Hàm PHP thông báo đặc điểm dữ liệu ngày tháng sinh đầu vào với lượng dữ liệu lớn (v1.2)

Dù dữ liệu ngày tháng năm sinh nhìn chung có cấu trúc ổn định, rất ít sai sót thì việc kiểm tra trước để có cái nhìn tổng quan về nó không thừa. Vì dữ liệu này sẽ liên kết rất nhiều đến các thống kê liên quan. Để chạy file này ngoài việc require đến database.php, bạn cần require đến: Hàm lười để lấy nhanh dữ liệu từ database; Các hàm để kiểm tra dữ liệu ngày tháng năm sinh người; Ví dụ khi tôi thử chạy với một tệp dữ liệu của mình: Mục tiêu của nó là …

Đọc thêm

Tạo hàm PHP lấy dữ liệu nhanh từ bảng CSDL

Nếu bạn hay phải thao tác với bảng dữ liệu thì đây có thể là cách nhanh gọn để lấy data. Nó là cách khá lười biếng, nhưng có tác dụng. default_table() để thiết lập tên mặc định cho bảng, phòng khi bạn có nhiều bảng khác nhau muốn thao tác, và thi thoảng muốn thay đổi tên mặc định này; table($limit) chính là data mà ta sẽ lấy, trong đó $limit là giới hạn số hàng dữ liệu; Nếu đầu vào là -1 ($limit), ví dụ table(-1), nghĩa là bạn lấy tất cả các hàng dữ liệu, tất cả …

Đọc thêm

Về TRUE và FALSE trong PHP

Trên trang php.net mở đầu phần giới thiệu bằng câu “This is the simplest type” tức “Đây là kiểu đơn giản nhất”. Nhưng nếu đọc thêm thông tin bên dưới, bạn sẽ thấy thực ra nó không đơn giản tí nào. Và nếu chúng ta không để ý sẽ lẫn như chơi thôi. True và False là kiểu dữ liệu Boolean, tức là nó tương ứng với 2 giá trị đúng hoặc sai, trong đó true là đúng, còn false là sai. PHP không phân biệt chữ hoa chữ thường, do vậy bạn viết true, TRUE hay True đều được, …

Đọc thêm

Xây dựng các hàm kiểm tra trước khi chỉnh sửa dữ liệu là điều rất quan trọng

Khi bạn xây dựng các hàm liên quan đến thao tác chỉnh sửa dữ liệu bạn rất nên cần phải tạo hàm kiểm tra trước xem một dữ liệu nào đó có cần phải chỉnh sửa không đã, nếu có thì mới dùng hàm chỉnh sửa để thao tác. Không nên đưa tất cả dữ liệu qua hàm chỉnh sửa ngay. Điều này có vài tác dụng: Tránh các thao tác thừa, đồng thời cải thiện hiệu suất, dù điều này không phải lúc nào cũng xảy ra; Quan trọng hơn nó phòng trường hợp các mã chỉnh sửa của …

Đọc thêm

Hàm PHP phát hiện các ký tự lạ trong họ tên người Việt Nam (v1.2)

Các ký tự lạ trong mẫu hơn 230 ngàn họ tên mà tôi có không nhiều, vì dữ liệu đầu vào đã khá chuẩn chỉnh rồi. Trong mẫu tỷ lệ chưa đến 0,1% dữ liệu dạng này. Ký tự lạ là các ký tự ngoài các chữ cái. Tạm thời không phân biệt tên nước ngoài, tên lai (tức là chấp nhận các ký tự f, j, w, z – phần này sẽ được lọc ở hàm khác). Các ký tự lạ này phần lớn là dạng chủ động, tức là người nhập liệu ý thức được việc này. Mục …

Đọc thêm

Viết lại hàm PHP sửa lỗi dính trong họ tên người (v1.2)

Lỗi dính họ tên có tỷ lệ không quá lớn, trong dữ liệu tôi khảo sát, con số nằm trong khoảng 0,2 – 0,3%. Ví dụ về lỗi dính họ tên: Nguyễn ĐứcAnh Một trong điều dễ chịu với lỗi này là lỗi dính họ tên rất dễ phát hiện, và cũng dễ sửa. Để đảm bảo quá trình chỉnh sửa có tỷ lệ chính xác cao và đáng tin cậy, việc tách từ dính được tiến hành như sau. Dựa trên ký tự viết hoa: Dựa trên ký tự Viết Hoa của từ, như trong ví dụ Nguyễn ĐứcAnh …

Đọc thêm

Viết lại hàm PHP chuyển dấu thanh cho từ tiếng Việt (v1.2)

Trước tôi có viết hàm chuyển dấu thanh, nó hoạt động tốt, nhưng mã rối, mà mã rối thì có vẻ vẫn không ổn rồi, nên hôm nay tôi sẽ viết lại. Về quy tắc đặt dấu thanh chúng ta dùng kiểu cũ, phổ biến hơn. Chúng ta sẽ không tranh cãi về mặt học thuật liên quan đến ngôn ngữ học, mà chỉ tập trung vào việc chuyển dấu để thống nhất. Có thống nhất được vị trí dấu thì các xử lý liên quan đến tiếng Việt mới chính xác được, khi nào có khả năng tôi sẽ …

Đọc thêm

Viết hàm PHP kiểm tra lỗi chính tả đơn giản cho tiếng Việt (v1.2)

Đã có phiên bản plus của hàm kiểm tra chính tả tiếng Việt, cho độ chính xác cải thiện thêm khoảng 20% so với hàm trong bài này. — Trong bài viết này tôi sẽ trình bày và viết hàm PHP phát hiện lỗi chính tả ở mức độ đơn giản, dù không đạt kết quả ấn tượng, nó vẫn loại trừ được khá nhiều trường hợp sai lỗi chính tả điển hình. Hàm này cần có các require sau trên cùng file để chạy: Các mảng nguyên âm, phụ âm tiếng Việt; Các hàm chuyển đổi mã hex; Các …

Đọc thêm

Các hàm PHP để thao tác với chuỗi tiếng Việt (v1.2)

Phần này tôi sẽ xây dựng các hàm để thao tác sâu hơn với chuỗi tiếng Việt nói chung, và họ tên người Việt nói riêng. Cái này sẽ sử dụng các function độc lập trước đó là: Các hàm chuyển mã hex; Các mảng phụ âm, nguyên âm, dấu tiếng Việt; Mã đầy đủ (phần giải thích cho từng hàm có dưới mã đầy đủ): 1. Loại bỏ khoảng trắng dư thừa trước, sau một từ Hai hàm cơ bản được dùng là: trim dùng để loại bỏ khoảng trắng trước và sau chuỗi; preg_replace để tìm 2 khoảng …

Đọc thêm

Các hàm PHP dùng để tách họ tên người tiếng Việt (v1.2)

Đây là các hàm PHP tôi thường sử dụng để thao tác với họ tên người tiếng Việt. Tiền tố vnn trong tên hàm là viết tắt cho từ vietnamese names. Các function trong file dưới đây là độc lập, nó không cần require đến file .php khác để hoạt động. Khi thao tác file này yêu cầu ngoài bản thân nó, còn có require đến file xử lý chuỗi tiếng Việt để chạy. Mã tổng hợp (phần giải thích cho từng function có ở phần sau mã tổng hợp): 1. Đếm số lượng từ trong tên Loại bỏ khoảng …

Đọc thêm