Giaosucan's blog - Chia sẻ kiến thức theo cách bá đạo

Ticker

20/recent/ticker-posts

Xây dựng AI Agentic platform nuoisugarbaby - Part 1

Anh X vốn là 1 SA của công ty F, hơn 15 năm chinh chiến kinh qua nhiều dự án, trả qua bao khó khăn cực khổ, hết khách chửi đến PM rủa, trên đe dưới búa, cuối năm chỉ nhận được vài đồng lương CHE.

Một ngày đông Hà Nội, anh 1 mình dạo bước trên con đường Trần Duy Hưng, thấy 1 người con gái với mái tóc dài như dòng suối mơ, co ro đứng đường dưới lớp áo mỏng manh

Hà Nội mùa này lạnh lắm, e đứng đây cả ngày rồi ko một ai thăm hỏi, em cô đơn lắm, chỉ ước có 1 người chăm sóc …

Thế là bao kỉ niệm ùa về, ngoài kia còn bao nhiêu mảnh đời còn khó khăn hơn mình.

Đã đến lúc ta phải dừng lại rồi, chặng đường ở F đã quá dài…

Anh quyết định nghỉ việc, lập startup, build up lên nuoisugarbaby.com , 1 platflorm kết nối người bảo trợ (daddy) và người được bảo trợ (baby) sử dụng Agentic AI


Business Requirement

Quản lý cơ sở dữ liệu Sugar Baby (người trưởng thành ≥18 tuổi) với thông tin cấu trúc

1 Baby được lưu trong DB với thông tin bắt buộc như sau

baby_id

nick-name (tieukieu_01, cobelolem_02…),

location

status (available / engaged / inactive)

mã baby (baby_code)

Thông tin mô tả : Số đo hình thể, kĩ năng (đàn ca sáo nhị cưỡi ngựa bắn cung…)

 Cho phép Daddy:

Tìm kiếm, lọc, truy vấn thông tin

Kết nối với Baby thông qua mã code

1 Daddy cũng được lưu trong DB với thông tin sau

Nghề nghiệp (kĩ sư, giám đốc, xe ôm etc…) Status: Đang nuôi mấy em

Thu nhập (Lương trăm củ, lương 3 cọc 3 đồng)

Budget range ( Chi phí nuôi chấp nhận)

Quản lý quan hệ nhận nuôi (sponsorship relationship) với các ràng buộc:

Một Daddy có thể nhận nuôi nhiều Baby, một Daddy owner nhiều mã code
Một Baby có thể được nhiều Daddy quan tâm
NHƯNG: một Baby không được overlap quan hệ active tại cùng thời điểm

Nói theo cách đơn giản, các Baby được chia theo slot theo ngày tháng hoặc giờ. Ví dụ 1 Baby được daddy nhận nuôi trọn ngày 2,4,6 thì Daddy khác không thẻ nhận nuôi trong khung timing này nữa, tránh tính trạng 1 cối nhiều chày, ảnh hưởng đến uy tín doanh nghiệp

Một Daddy sau khi đã nhận nuôi 1 bé sẽ kết nối tài khoản ngân hàng thông qua Payment Gateway trong hệ thống (Paypal hoặc Stripe), deposite 1 khoản tiền bằng chi phí 1 tháng nhận nuôi. Mỗi tháng hệ thống sẽ tự động khấu trừ tiền trong tài khoản của Daddy, cho đến khi huỷ lệnh nhận nuôi.

Trường hợp Daddy nào cố ý chê ỳ không thanh toàn, các Agentic AI sẽ tự động bắn mail, message khủng bố, warning.

System architect

Hệ thống gồm nhiều Agentic AI, mỗi AI agent thực hiện các tác vụ khác nhau như tìm kiếm baby, matching Daddy với Sugger, collect profile Daddy and Baby etc...
Tất cả agent này được manage bởi Agent Orchestrator, mỗi Agent sử dụng MCP, giúp agent có đủ các tool để truy cập tìm kiếm thông tin mà nó cần

Front End layer

Daddy dùng AI Prompt (ngôn ngữ tự nhiên) để tìm kiếm & lựa chọn Baby qua Web/mobile client UI. Tuy nhiên để tối ưu trải nghiệm người dùng, cần giải pháp Prompt Engineering hoàn chỉnh để tối ưu trải nghiệm người dùng (Daddy) khi tìm kiếm & lựa chọn Baby bằng AI, để AI có thể hiểu đúng tránh hiện tượng Ai hallucination

Đây là 1 workflow Prompt

User Prompt: Thay vì phải bắt user viết những prompt dài phức tạp như

“Tôi muốn tìm baby ở Trần Duy Hưng, tiêu chí 2K1, giỏi đàn ca sáo nhị, mặt ưu nhìn, biết chiều chuộng blo bla…"

Hệ thống sẽ build sẵn các prompt dạng Markdown file như ở dưới. Mỗi prompt có mục đích rõ ràng, input/output chuẩn hóa, sẵn sàng dùng trong production. Các daddy chỉ cần điền form dạng prompt

Các Daddy ko hề nhìn thấy các markdown này, họ chỉ cần fill form UI, tối ưu trải nghiệm. Backend sẽ tự render vào các markdown prompt để gửi tới Agentic AI để xử lý

Để đảm bảo việc tìm kiếm thông tin chính xác, các Agentic AI sử dụng kĩ thuật là

Semantic matching + Vector search

Mấy cái tech concept này có thể tìm kiếm trên Google nhưng hơi lú còn hiểu theo giaosucan’s blog thế này

Daddy prompt AI

Bố muốn tìm 1 suggar baby giỏi đàn ca sáo nhị

Theo kiểu cũ, AI sẽ tìm thông tin về đàn (ghitar , pianio), giọng ca (trầm khàn…)

Nhưng semantic matching, AI sẽ tìm hiểu ý nghĩa của câu hỏi, nó giống hệt như 2 ông checker nói chuyện với nhau vậy. Nội dung trên không hề liên quan đến đàn ca, mà có tầng nghĩa khác, semantic matching giúp AI hiểu y hệt như 2 anh checker trên

Flow của 1 Semantic matching như sau

Embedding Model biến 1 đoạn văn thành vector số học, rồi lưu vào trong vector database

“giỏi đàn ca sáo nhị”

→ [0.12, -0.88, 0.44, …]

Các kĩ sư của startup sử dụng OpenAI Embeddings để thực hiện vector hoá nội dung prompt và lưu vào vector db sử dung Qrand . open source khá phổ biến, cài đặt trên ECS cluster

Rule Engine Integration

Để đảm bảo AI trả về đúng nhất, loại bỏ thông tin thừa, kĩ thuật Ranking + Rule engine được apply

Hiểu 1 cách đơn giản non-tech thế nay, AI tìm kiếm được 3 em babby thoả mãn tiêu chí của Daddy, AI cần phải ranking, chấm điểm các em này để chọn ra 1 em ngon nhất matching nhất --> Schematic Ranking

Ví dụ



Technique ở trên gọi là Rule-based Scoring đánh theo tiêu chí vào trọng số

Kiểu như 1 em Sugar tên Tiểu Kiều có kinh nghiệm thực chiến > 2 năm, ở khu vực trong vòng bán kính 2km gần nhà Daddy thì được chọn, còn ko thì loại

Stack hoàn chỉnh như sau cho phần schemantic matching như sau

Muốn biết các kĩ sư xây dựng Agent Orchestrator thế nào đòn đọc tập 2

Đăng nhận xét

0 Nhận xét