Hỏi AI: Tỉnh nào sau sát nhập có tổng biển số lớn nhất?
Sáng nay (27-20-2026), khi vào hầm gửi xe thì có một câu hỏi hiện lên trong đầu tôi: sau khi sát nhập các tỉnh, nếu cộng biển số xe của các tỉnh cũ lại (ví dụ Hưng Yên mới = Hưng Yên Cũ (89) + Thái Bình cũ (17)) thì tỉnh mới nào sẽ có tổng biển số xe lớn nhất?
Tôi nghĩ nhờ AI tính xem sao.
Trước tiên tôi hỏi xem Việt Nam có bao nhiêu tỉnh thành. Kết quả rất bất ngờ vì cả ChatGPT, Claude, Gemini đều trả lời là 63 tỉnh thành ở kết quả đầu tiên, ngoại trừ CoPilot trả lời là 34 tỉnh thành.
Cần nói rõ là tôi dùng ChatGPT, Gemini bản miễn phí, CoPilot thì được tích hợp trong Microsoft Edge của Công ty (dùng model ChatGPT 5) còn Claude là bản trả phí (Pro).
Thử nghiệm nho nhỏ này để tóm tắt lại một vài điểm cần lưu ý khi sử dụng AI tôi sẽ viết ở cuối bài.
Bây giờ hãy xem kết quả:
1. ChatGPT (GPT-5.2)
Sau khi tôi hỏi lại: "tính đến 2026 Việt Nam có bao nhiêu tỉnh thành?", ChatGPT vẫn trả lời sai:
2. Gemini 3
Tương tự với ChatGPT, Gemini khi được hỏi lại cũng vẫn trả lời là Việt Nam có 63 tỉnh thành.
3. Claude Sonnet 4.6
Đây là bản trả phí, câu trả lời đầu tiên Sonnet 4.6 trả lời là 63 tỉnh thành, sau đó tôi hỏi "tính tới 2026" thì Sonnet 4.6 bắt đầu đi tìm kiếm thông tin trên web và đưa ra câu trả lời chính xác là 34 tỉnh thành sau sát nhập.
4. CoPilot (model ChatGPT-5)
Đây là bản CoPilot nằm trên Microsoft Edge, tôi nghĩ nó trả lời chính xác ngay từ đầu là có 34 tỉnh thành vì nó truy cập dữ liệu trực tiếp trên Website, trong khi những model kia sử dụng dữ liệu được đào tạo từ trước.
Sau khi hỏi số lượng tỉnh thành, tôi không dùng ChatGPT và Gemini nữa vì nó trả lời sai 2 lần.
Tiếp tục hỏi CoPilot và Claude:
Câu hỏi: "bây giờ hãy xem biển số các tỉnh trước và sau sát nhập, ví dụ Thái Bình là 17, Hưng Yên là 89. Thử tính xem sau khi sát nhập, tỉnh nào có tổng biển số lớn nhất (tổng biển số ví dụ Hưng Yên sau sát nhập = 17+89)".
Mục đích của tôi là xem sau sát nhập tỉnh nào có tổng các ký hiệu biển số lớn nhất.
Dưới đây là kết quả từ CoPilot:
TP. Hồ Chí Minh với tổng cộng là 536.
Sau đó là Bắc Giang, tổng 197.
Hà Nội đứng thứ 3 với 195.
Đây là kết quả sai.
Hãy cùng xem kết quả từ Claude Sonnet 4.6 (tính toán khá lâu mới ra kết quả).
Đây là kết quả đúng, tôi đã kiểm tra lại danh sách biển số các tỉnh trước sát nhập (tại đây) và tính thử.
Claude cũng đưa ra một số điểm cần làm rõ từ các nguồn nó tìm để xem biển số các tỉnh có đúng không. Nếu tôi cung cấp danh sách biển số các tỉnh trước sát nhập ở trên cho Claude thì nó sẽ tính nhanh hơn.
Như vậy, với một câu hỏi đơn giản và thử dùng 4 công cụ AI khác nhau, chúng ta thấy kết quả không giống nhau.
Với một ví dụ nhỏ như vậy, điều tôi rút ra là gì:
1. Không thể tin tưởng AI hoàn toàn, luôn cần kiểm chứng thông tin. Và để kiểm chứng thông tin, bạn cần có kiến thức. Nếu trong đầu tôi hoàn toàn không có ý niệm gì về việc Việt Nam đã sát nhập tỉnh thành trong năm 2025, tôi sẽ không nghĩ cần kiểm tra lại kết quả, vì khi hỏi thì cả 3 công cụ đểu cho ra một kết quả giống nhau là 63 tỉnh thành.
2. Đưa nguồn dữ liệu chính xác cho AI sẽ giúp quy trình xử lý nhanh chóng hơn (ví dụ trường hợp Sonnet 4.6 tính toán ở trên, nó phải nghĩ nhiều về việc biển số nào của tỉnh nào mới đúng trong trường hợp những website nó đọc có kết quả khác nhau, nếu mình đưa cho nó một dữ liệu chuẩn thì nó sẽ xử lý nhanh hơn nhiều và đỡ tốn năng lượng. Chỉ với một tính toán cho câu hỏi trên, tôi mất 10% usage của Claude trong ngày). Và để có được nguồn dữ liệu chính xác, bạn vẫn cần phải có kiến thức, ít nhất là biết kênh nào chính thống để tìm kiếm thông tin.
3. Nếu dùng AI để phục vụ công việc, hãy cân nhắc sử dụng bản trả phí để có chất lượng kêt quả cao hơn. Ít nhất trong trường hợp này, bạn có thể thấy Claude Sonnet 4.6 tính toán tốt hơn rất nhiều, cách trình bày cũng thông minh hơn.
Trong bài viết này, tôi không muốn so sánh các công cụ với nhau. Tôi đã trải nghiệm bản trả phí của cả ChatGPT, Gemini và hiện đang dùng Claude Pro, nhưng không dùng trong cùng một thời điểm nên rất khó đánh giá công cụ nào tốt hơn. Cá nhân tôi thích dùng Claude vì nó phù hợp để hỗ trợ những công việc của bản thân. Bạn hãy thử trải nghiệm và tìm ra công cụ phù hợp nhất để trả phí, còn lại vẫn có thể dùng nhiều công cụ miễn phí cho các mục đích khác nhau.
Comments
Post a Comment