- Nhập thủ công hoặc load từ file text/srt
- Có thể hoạt động không tốt với
- các ký tự số
- ngày tháng
- ký tự đặc biệt
- cụm từ viết tắt
=> Sử dụng bảng map phiên âm (DIC file- file config). Ví dụ khai báo: VN = Việt Nam -> Văn bản xuất hiện từ “VN” sẽ đọc thành “Việt Nam”.
=> hoặc sử dụng các module chuẩn hóa văn bản trước (ChatGPT, Germini, …) để loại bỏ các ký tự đặc biệt, kiểm tra lại chính tả, chia ngắt câu hợp lý cho đúng văn phong nói. Ví dụ prompt:
Tôi muốn chuyển văn bản sau thành audio, nên hãy giúp tôi chuẩn hóa lại câu cú cho hợp lý:
- không được thay đổi bất kỳ từ nào, trừ những từ sai chính tả
- chỉ sử dụng dấu chấm, dấu phẩy để ngắt câu.
- loại bỏ các ký tự đặc biệt, ký tự không cần thiết
- một câu kết thúc bằng dấu chấm, không quá dài và hạn chế các câu quá ngắn
- xử lý và trả về đầy đủ toàn bộ nội dung một lần
đây là nội dung: ….
Lưu ý
- Mỗi lần Tool sẽ xử lý 1 đoạn văn bản, mỗi văn bản nhiều câu (kết thúc bằng bằng dấu . ? ; )
- Đừng quên các dấu câu này, nếu văn bản quá dài mà ko có dấu câu (> 20s audio) thì AI ko suy luận được.
- Nếu sở dụng dấu “xuống dòng” hoặc dấu ! -> tính là ngắt đoạn luôn.
- Tool ko tự động thay thế toàn bộ ký tự đặc biệt -> mục đích cho người dùng có thể sử dụng bảng phiên âm để đọc cả những ký tự hay cụm từ đặc biệt này -> đảm bảo các ký tự đặc biệt đã được khai phiên âm nếu sử dụng nếu ko sẽ bị lỗi phát âm (hoặc lỗi gen nếu gặp các ).
- Có thể can thiệp việc ngắt nghỉ chủ động (sleep 1 khoảng trước khi đọc tiếp) bằng cách thêm [PAUSE=x.y] vào cuối câu => ví dụ: [PAUSE=1.5]! là nghỉ 1.5s
ký tự ! ở sau cú pháp [PAUSE=x.y] nếu viết liền hoặc dấu “xuống dòng” để đảm bảo đoạn văn được ngắt ở đây
Leave a Reply