Viết 1 chương trình chuyển đổi văn bản thành giọng nói

Điều hướng
Tài khoản
- Đăng ký
- Đăng nhập

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

Viết 1 chương trình chuyển đổi văn bản thành giọng nói

Lên lịch Đã ghim Đã Khóa Đã chuyển
Cafe Công Nghệ
aitype yenai

1 1 56

A
96

100,000,000

A

admin

Tôi nhớ ngày xưa làm Podcast cứ phải ngồi trước cái máy tính, cố đọc và nói thật mượt vào cái mic (nước bọt văng tùm lum). Sau khi đọc được tầm 1h thì mỏi hết cả miệng ra, giọng khản khản kiểu con vịt đực mới được 1 file audio mình mong muốn.

Mà cái thời đó cũng xảy ra cách đây thôi, không lâu đâu. Trước cái vụ AI ra đời và lan rộng như bây giờ.

Ngày nay cách làm đơn gian hơn nhiều, chỉ cần 1 con AI viết kịch bản -> đọc duyệt lại nội dung -> đưa vào chương trình chuyển đổi văn bản thành giọng đọc -> chọn giọng đọc của chính mình -> cho chạy chương trình -> chờ 1 lúc rồi bấm lưu kết quả.

Không còn phải đọc nữa, không còn phải mất hàng giờ trước máy tính nữa mà vẫn có thể sản xuất hàng loạt nội dung podcast theo ý mình, đúng tông giọng của mình luôn.

Câu hỏi là mình đã làm cách nào để xây dựng được 1 công cụ như thế?

Bạn cần có 1 con AI dựng kịch bản, 1 công cụ chuyển đổi văn bản thành giọng đọc, 1 con AI tạo hình ảnh, 1 con AI bắn subtile tự động. Kết nối chúng nó lại với nhau bằng 1 công cụ cuối rồi bấm nút chạy thôi.

Chi tiết mình sẽ viết rõ dưới thread này nhé!

Làm gì thì làm cũng phải đi ngủ cái đã.
0

Bài liên quan

A 0 1

A 0 1

Xây dựng Website chuyên nghiệp với Softaculous AI Website Builder (SoftWP)

Cafe Công Nghệ

+2

Lên lịch Đã ghim Đã Khóa Đã chuyển
A 0 3

A 0 3

Tự học và làm em Chatbot AI biết nói chuyện của tôi :)

Cafe Công Nghệ

Các bước làm Chatbot siêu dễ thương của mình là như sau ạ Tuy là lần đầu tiên làm chatbot nhưng vụ này mình muốn làm từ lâu rồi, còn hồi trên ghế nhà trường đã muốn làm 1 con để phục vụ riêng cho mình, và bây giờ nhờ có các công cụ như ChatGPT, Gemini mà mình có thể thực hiện hoá ý tưởng của mình được. Tuy là chưa được xịn nhưng mình sẽ cải tiến nó dần dần. Bước 1/ Lên ý tưởng: Học hành: Con bot nó phải học được nội dung website của mình, hoặc bất kỳ website nào khác. Tiếp tục học: Ngoài ra nó có thể học luôn các tài liệu văn bản như PDF, Doc,... ===> Nói chung con bot nó phải thông minh hơn mình là chắc chắn rồi, với cả nó cần phải có kiến thức chuyên sâu về một vài lĩnh vực mà mình muốn nó phục vụ. Để sau này có gì cần hỏi thì nó sẵn sàng trả lời và đưa cho mình những giải pháp tốt nhất. Bước 2/ Nền tảng Bắt đầu học: Python (làm API), Cơ Sở Dữ Liệu (lưu những thông tin cơ bản như tài khoản), HTML5 + CSS3 (làm giao diện Chatbot), Javascript (Điều khiển mấy thứ linh tinh), Angular (làm giao diện Chatbot). Học đúng trọng tâm thôi, lan man biết nhiều chỉ tổ dễ bị tẩu hoả nhập ma. Công cụ: ChatGPT (để hỏi), Gemini (để lấy Key làm việc với LLM), LLM (Large Language Model mô hình ngôn ngữ giải quyết mọi câu hỏi của mình) Cơ sở vật chất: Máy tính bàn, Card đồ hoạ (không có card rồi thì nghỉ chơi luôn),... ===> Dù là chưa biết gì về lập trình nhưng những vấn đề mình vạch ra đều có thể giải quyết được. Các ngôn ngữ lập trình này đều rất phổ thông và có thể tìm tài liệu học dễ dàng. Không lạm dụng ChatGPT để giải quyết hoàn toàn công việc của mình. Bước 3/ Cài đặt Hệ điều hành: Linux hoặc Windows (mình chọn Win vì nó thân thiện) Phần mềm: Cài python 3.12 mới xíu cho đỡ lạc hậu, Cài Angular CLI (thực ra thì mình thích dùng Angular hơn mấy cái React, Vue,... nên mình chọn nó để làm Web app, sau này có thể làm luôn Desktop App nếu thích). Cài MongoDB để làm CSDL, HTML CSS và Javascript thì không cần cài gì vì trình duyệt tự đọc tự hiểu được rồi. Cài Visual Studio để gõ code, ngoài ra còn 1 số thứ linh tinh cần dùng tới Terminal (Command Prompt, Power ...) của Windows. Phần cứng: Chạy ra tiệm mua con máy bàn cấu hình kha khá chút, nhớ mua kèm 1 em card đồ hoạ cũ cũng được nhưng không có thì hơi phiền á, còn không có thì thôi dùng Chip xử lý thay Card đồ hoạ rời cũng được. Bước 4/ Vừa học vừa hành Không dễ chút nào: Đầu tiên là việc cài đặt cho đủ các phần mềm, các thư viện Python cần thiết. Nhưng mãi cũng xong thôi. Chương trình đầu tiên: Không phải Hello World như học trên ghế nhà trường đâu, nó có ti tỉ thứ cần phải nói Helllo đó. Hình thành đầu tiên: Đầu tiên mình thử phát triển với 1 file python trước, mình đặt tên cho nó là bot.py và bắt đầu viết những dòng code đầu tiên. ===> Những giai đoạn tiếp theo mới thực sự gian nan và vất vả, mình sẽ viết tiếp trong ngày kế nhé. Anh em nào quan tâm thì Comment dưới để cùng mình trao đổi tiếp nhé.

Lên lịch Đã ghim Đã Khóa Đã chuyển
B 0 1

B 0 1

Hơn 8000 nhà văn, nhà thơ đòi bồi thường vì AI

Cafe Công Nghệ

Bạn có suy nghĩ gì về bài viết này?

Lên lịch Đã ghim Đã Khóa Đã chuyển
C 1 2

C 1 2

Bạn có biết iPhone 14 chính hãng Việt Nam hỗ trợ 2 eSIM online cùng lúc?

Cafe Công Nghệ

ip14 đã thử nha cô Mía :)) yêu thế, hóng member xài iPhone ver thấp hơn check [image: 1681865124356-6400408_iphone_14_chinh_hang_2esim-resized.jpg]

Lên lịch Đã ghim Đã Khóa Đã chuyển
B 0 1

B 0 1

Chính phủ Nhật Bản dùng ChatGPT tóm tắt công văn cho người dân dễ hiểu

Cafe Công Nghệ

Bạn có suy nghĩ gì về bài viết này?

Lên lịch Đã ghim Đã Khóa Đã chuyển
A 0 3

A 0 3

DaVinci Resolve vừa mới ra mắt bản 18.5 beta với công cụ AI hỗ trợ

Cafe Công Nghệ

+1
Đang fix lỗi diễn đàn chưa đăng được nhé. Xong sẽ thông báo với mn!

Lên lịch Đã ghim Đã Khóa Đã chuyển
A 0 1

A 0 1

Giáo sử kể chuyện chôm bài luận của ChatGPT

Cafe Công Nghệ

Bạn có suy nghĩ gì về bài viết này?

Lên lịch Đã ghim Đã Khóa Đã chuyển
A 0 1

A 0 1

CEO tài năng đứng sau thành công của siêu AI ChatGPT

Cafe Công Nghệ

+0

Lên lịch Đã ghim Đã Khóa Đã chuyển