flag

[Nhật ký phát triển] Thử và sai của hệ thống dịch thuật AI: Sự khác biệt giữa cục bộ và máy chủ, và cạm bẫy của phiên bản curl

Xin chào. Hôm nay, tôi muốn chia sẻ một vấn đề kỹ thuật thú vị mà tôi gặp phải trong quá trình phát triển blog và quá trình giải quyết nó.



1. Khởi đầu của vấn đề



Trong môi trường phát triển cục bộ (Windows), văn bản được viết bằng giọng nói (Dictation) được dịch bình thường, nhưng trên máy chủ hoạt động thực tế (Linux), bản dịch không thành công.

Ban đầu, nó có vẻ là một lỗi nhật ký đơn giản (sh: curl.exe: command not found) và tôi cho rằng đó là một vấn đề về đường dẫn, nhưng có một nguyên nhân sâu xa hơn.



2. Phân tích nguyên nhân




- Sự khác biệt về hệ điều hành: Windows sử dụng lệnh curl.exe, trong khi Linux sử dụng lệnh curl. Mã không tự động phát hiện ra điều này.
- Khả năng tương thích phiên bản Curl: Phiên bản curl được cài đặt trên máy chủ là 7.61.1 (2018). Tùy chọn xử lý song song tốc độ cao (--parallel) mà tôi đã áp dụng chỉ được hỗ trợ trong 7.66.0 trở lên. Do đó, bản thân yêu cầu dịch không thành công trên máy chủ.
- Bộ lọc an toàn AI: Tôi cũng phát hiện ra rằng một số câu có chứa tiếng lóng hoặc tiếng địa phương đã bị từ chối dịch do bộ lọc an toàn (Safety Filter) của AI.


3. Quá trình giải quyết




- Tự động phát hiện hệ điều hành: Tôi đã sửa đổi mã để sử dụng hằng số PHP_OS để xác định xem môi trường thực thi là Windows hay Linux và chọn lệnh thích hợp.
- Giới thiệu phương pháp xử lý tuần tự: Để tương thích với máy chủ, tôi đã từ bỏ chức năng mới nhất là 'xử lý song song' và tổ chức lại toàn bộ logic theo phương pháp 'xử lý hàng loạt tuần tự (Sequential Batch Processing)' ổn định. Tốc độ có thể chậm hơn một chút, nhưng nó đảm bảo hoạt động 100% trong mọi môi trường.
- Tắt bộ lọc an toàn: Để tự do thể hiện các bài đăng trên blog, tôi đã đặt bộ lọc an toàn thành BLOCK_NONE khi dịch để bản dịch không bị kiểm duyệt.


4. Kết luận



Tôi một lần nữa nhận ra rằng mặc dù công nghệ mới nhất là tốt, nhưng sự hiểu biết về môi trường hoạt động (Legacy) phải được ưu tiên. Bản dịch đa ngôn ngữ hiện được cung cấp ổn định trong mọi môi trường.

Bình luận

Chưa có bình luận nào. Hãy là người đầu tiên chia sẻ suy nghĩ của bạn!

© 2026 My Blog. All rights reserved.