Lưu ý nội dung văn bản

Nhập thủ công hoặc load từ file text/srt

Có thể hoạt động không tốt với

các ký tự số

ngày tháng

ký tự đặc biệt

cụm từ viết tắt

=> Sử dụng bảng map phiên âm (DIC file- file config). Ví dụ khai báo: VN = Việt Nam -> Văn bản xuất hiện từ “VN” sẽ đọc thành “Việt Nam”.
=> hoặc sử dụng các module chuẩn hóa văn bản trước (ChatGPT, Germini, …) để loại bỏ các ký tự đặc biệt, kiểm tra lại chính tả, chia ngắt câu hợp lý cho đúng văn phong nói. Ví dụ prompt:

Tôi muốn chuyển văn bản sau thành audio, nên hãy giúp tôi chuẩn hóa lại câu cú cho hợp lý:

không được thay đổi bất kỳ từ nào, trừ những từ sai chính tả
chỉ sử dụng dấu chấm, dấu phẩy để ngắt câu.
loại bỏ các ký tự đặc biệt, ký tự không cần thiết
một câu kết thúc bằng dấu chấm, không quá dài và hạn chế các câu quá ngắn
xử lý và trả về đầy đủ toàn bộ nội dung một lần

đây là nội dung: ….

Lưu ý

Mỗi lần Tool sẽ xử lý 1 đoạn văn bản, mỗi văn bản nhiều câu (kết thúc bằng bằng dấu . ? ; )

Đừng quên các dấu câu này, nếu văn bản quá dài mà ko có dấu câu (> 20s audio) thì AI ko suy luận được.

Nếu sở dụng dấu “xuống dòng” hoặc dấu ! -> tính là ngắt đoạn luôn.

Tool ko tự động thay thế toàn bộ ký tự đặc biệt -> mục đích cho người dùng có thể sử dụng bảng phiên âm để đọc cả những ký tự hay cụm từ đặc biệt này -> đảm bảo các ký tự đặc biệt đã được khai phiên âm nếu sử dụng nếu ko sẽ bị lỗi phát âm (hoặc lỗi gen nếu gặp các ).

Có thể can thiệp việc ngắt nghỉ chủ động (sleep 1 khoảng trước khi đọc tiếp) bằng cách thêm [PAUSE=x.y] vào cuối câu => ví dụ: [PAUSE=1.5]! là nghỉ 1.5s

ký tự ! ở sau cú pháp [PAUSE=x.y] nếu viết liền hoặc dấu “xuống dòng” để đảm bảo đoạn văn được ngắt ở đây

AI VOICE CLONING

Lưu ý nội dung văn bản

Lưu ý

Leave a Reply Cancel reply