Giaosucan's blog - Chia sẻ kiến thức theo cách bá đạo

Ticker

20/recent/ticker-posts

Voice AI - Công nghệ thiên lý truyền âm - part 1


Thời Nam Tống , Nam Đế Đoàn Trí Hưng là một trong thiên hạ ngũ tuyệt, với tuyệt kỹ gia truyền là Nhất Dương Chỉ và Thiên Lý Truyền Âm. Môn võ công này được ông lĩnh ngộ được khi nhìn thấy cá nhà táng ở Nam Hải phát ra tiếng kêu để gọi đồng loại. Đây là một loại âm công có thể đứng cách xa ngàn dặm mà nói cho đối phương nghe như gần trong gang tấc.  Người công phu cao thâm có thể truyền âm đi xa trăm dặm, hơn nữa, nội công càng thâm hậu, thì âm thanh nghe càng nhu hòa, không bị lag, ngoài ra còn hỗ trợ noise cancelling, noise background remover, quả thực lợi hại

Sau này, quân Mông Cổ chiếm nước Đại Lý, Đoàn Trí Hưng sợ võ công của Thiên Lý Truyền Âm bị thất truyền, nên đã ghi lại công pháp vào một cuốn da dê, giấu trong thanh Đồ Long Đao, rồi giao lại cho con trai là Đoàn Diên Khánh. Đoàn Diên Khánh dẫn theo gia đình vượt Nam Hải sang Úc châu lánh nạn. Từ đó công pháp của Thiên Lý truyền âm được truyền lại cho các thế hệ sau của nhà họ Đoàn. Tuy nhiên để học được môn võ công này, đòi hỏi người luyện phải tu tập nội công trong vòng 10 năm, nên họ Đoàn ít người học được, Thiên Lý truyền âm dần dần bị thất truyền, tuyệt tích giang hồ

May thay, trời xanh chưa tuyệt họ Đoàn, hơn 1K năm sau, một vị anh hùng xuất thiếu niên là Humphrey Doan, cháu 10 đời của Đoàn Trí Hưng, đã nghĩ ra giải pháp sử dùng VoiceAI, cho phép user dù cho không có căn bản về nội công vẫn có thể luyện được Thiên Lý Truyền Âm

Vậy giải pháp VoiceAI Hymphrey Doan là gì

Giải pháp VoiceAI

Thời đó, nhiều ngân hàng, tài chính của Úc Châu như ANZ để sử dụng hệ thống Call Center, người dùng có vấn đề gì thì gọi vào call center để được support. Hàng ngày, thống kê có vài trăm nghìn cuộc gọi đến từ khắp nơi, hỗ trợ, than phiền, tình cảm, nội dung đủ loại. Đây là một nguồn Big Data để các kĩ sư DA phân tích. VoiceAI cho phép chuyển đổi voice call này thành searchable text, cho phép lưu trữ và sort theo từng thể loại (hỗ trợ, than phiền, tình cảm …) Về cơ bản, VoiceAI là bản nâng cấp của công pháp Thiên Lý Truyền Âm, không chỉ truyền âm thanh được đi xa, mà còn có thể convert thành text để lưu trữ trong database

VoiceAI sử dụng Automatic Speech Recognition engine, được phát triển bởi voci tech, để tự động chuyển đổi voice converstation thành transcript . VociASR sử dụng mạng neural networks and deep belief networks, để convert speed thành data, tự động thêm dấu chấm câu, chữ hoa, tự động biên tập nội dung, xóa bỏ tạp âm, nhận dạng có bao nhiêu người nói, detect được cảm xúc của người nói nhưng tức giận, vui vẻ, phàn nàn .. Đặc biệt là chức năng overtalks, kiểu phát hiện có người nọ nói cướp lời của người kia…

Technologies – elitr.eu

Vì sử dụng AI, nên các server ASR của VoiceAI để sử dụng card đồ họa của NVIDIA , cài đặt CUDA CUDA core  là một nhân xử lý trong GPU của card đồ họa – thiết bị tính toán xử lý đồ họa

Tuy nhiên, sau khi các voice conversation được chuyển đồi thành text, cần một công cụ để phân tích visualize data này. Vì không thể nào manually đọc hay ngồi nghe hàng ngàn cuộc gọi mỗi ngày, do đó VoiceAI đã phát triển công nghệ gọi là V-Spark Voice Analytics™, cho phép monitor tất cả tương tác của user, tự động analyze voice data thông qua các công cụ BI analytics

VSpark được cài đặt trên các server của VoiceAI cho phép các kĩ sư DA có thể , collect voice data từ người dùng, visualize thành dashboard để phân tích , kiểu như một ngày có bao nhiêu cuộc gọi với nội dung than phiền, yêu cầu tư vấn … Từ đó giúp cải thiện user experiences ,

VSpark cũng cung cấp API, để developer có thể tích hợp vào hệ thống của họ, cho phép upload/download audio vào VSPARk để processing.

Từ ngày được tích hợp VoiceAI, công pháp Thiên Lý truyền âm các được nhiều người sử dụng, không chỉ có Úc Châu mà còn Mỹ Quốc, Nga Xô đều sử dụng. Humphrey Doan quyết định đăng ký bằng sáng chế môn võ công này. Công ty nào dùng thì phải trả phí dịch vụ. Ngày nay những ứng dụng Voice call như Zalo, Zoom, Google Meet đều sử dụng bộ core của Thiên Lý Truyền Âm này cả. Nhờ đó mà cty startup của Humphrey Doan ngày càng phát triển, revenue đạt hàng triệu mỹ kim 

Tuy nhiên cũng có nhiều thách thức được đặt ra

  • Số lượng voice call hàng ngày lên tới hàng chục nghìn, dẫn tới nhu cầu lưu trữ khổng lồ, cần có giải pháp lưu trữ, backup, rotation logs data tối ưu để giảm chi phí
  • Hàng trăm cuộc gọi xảy ra đồng thời, đồng nghĩa phải có giải pháp chạy xử lý song song để xử lý các voice call tới cùng 1 lúc
  • Voice Call là dữ liệu khách hàng, làm thế nào để đảm bảo privacy, quy trình xử lý Distaster recovery

Muốn biết Humphrey Doan giải quyết ra sao. Đón đọc tập sau

Đăng nhận xét

0 Nhận xét