Thực tập sinh đọ sức với Robot. Ai năng suất hơn?
Figure là công ty sản xuất AI robot, bữa giờ nó nổi tiếng với video livestream mấy chục tiếng liên tục không nghỉ quay robot phân loại hàng hoá.
Bây giờ Figure so sánh luôn tốc độ của robot so với thực tập sinh. Sau 10 tiếng, thực tập sinh vẫn đang dẫn trước tốc độ cho dù đã có 30 phút nghỉ ăn trưa, đi toilet,...
Nhưng theo cái đà này thì chắc con người khó bắt kịp robot rồi 🤖🦾🦿

Tuyệt lắm Tencent, ra sản phẩm xịn nhưng không support tiếng Anh 😤
@TencentGlobal vừa ra mắt Ardot - design agent cho AI bắt đầu cover gần như toàn bộ workflow UI/UX.
Có thể prompt để tạo giao diện, sửa trực tiếp từng element bằng ngôn ngữ tự nhiên, import nguyên file Figma và chuyển design thành code để làm việc tiếp với Cursor hay Claude Code thông qua MCP.
Thấy giống @Affinity của @canva , có anh em nào test chưa?
Link cho anh em biết tiếng Trung trải nghiệm https://t.co/AUAhjjkHPc
---
🤔 Bản quyền ca khúc AI này thuộc về AI?
Hôm nay mình thử làm một bài nhạc tiếng Việt về chủ đề chuyến đi chơi bằng Google AI.
Nhưng câu hỏi đáng nói hơn là nếu AI làm ra bài này thì mình có sở hữu nó không, có đăng ký bản quyền được không, và Google có tạo bài gần giống cho người khác không?
Mình hỏi luôn Gemini thì câu trả lời là 👇
Google có nói họ không nhận quyền sở hữu đối với nội dung gốc do công cụ AI của họ tạo ra. Nhưng điều đó không có nghĩa là bài nhạc tự động trở thành tài sản độc quyền của mình.
Trong điều khoản của Gemini API, Google cũng ghi rõ là hệ thống có thể tạo ra nội dung giống hoặc gần giống cho người khác. Nghĩa là Google không giành bài của mình, nhưng cũng không cam kết bài đó là duy nhất.
Google cũng không cấp cho mình một mã sở hữu hay giấy chứng nhận bản quyền nào cho bài nhạc AI. Thứ họ có là SynthID, tức dấu nhận diện ẩn để xác định đây là nội dung do AI tạo ra. Cái này chỉ để nhận diện nguồn gốc, không phải để chứng minh quyền sở hữu.
Về bản quyền thì nếu phần giai điệu, phối khí, giọng hát và file audio cuối cùng đều do AI tạo gần như toàn bộ, thì phần đó thường rất khó được bảo hộ bản quyền theo kiểu truyền thống. Cơ quan Bản quyền Mỹ cũng nói khá rõ rằng chỉ viết prompt thôi thường chưa đủ để tạo ra quyền tác giả đối với toàn bộ đầu ra.
Nhưng nếu mình là người tự nghĩ ý tưởng, tự viết lời, tự chọn cấu trúc, tự chọn hợp âm, tự sửa nhiều vòng, hoặc lấy bản AI làm nháp rồi phát triển tiếp, thì phần đó vẫn là phần sáng tạo của mình và có thể đăng ký bản quyền.
Cách dùng SynthID 👇
Vào Gemini, bấm `Thêm tệp` rồi tải file từ `Tệp`, `Thư viện ảnh` hoặc `Drive`.
Sau đó hỏi: `File này có phải do Google AI tạo hoặc chỉnh sửa không?` & `Đây có phải nội dung AI không?`
Hoặc nhập thẳng `@synthid` để kiểm tra. Nếu lấy file từ Drive, bạn phải bật `Keep activity` và kết nối Google Workspace với Gemini Apps.
https://t.co/VPW37RkZ2W
Follow @nghienaivn ở đây nè 🔥
https://t.co/wOX7GsW3qv
----
Đã áp dụng và thành công có video 95 view tự động 100% 😁
Hôm bữa anh Đăng có hướng dẫn cách làm video ngắn tự động bằng AI để đăng lên YouTube ở đây
https://t.co/zEWTL9Rfxs
Mình cũng học theo làm thử luôn và cuối cùng ra được 1 đống video short tự đăng 😁
Link Diu-Túp https://t.co/go29blcZOw
Ảnh hướng dẫn từ trước khi ảnh đăng cái post này rồi nên mọi người thấy mấy video trên kênh đó đăng trước khi ảnh post bài
Mọi người coi qua thôi chứ đừng cười vì video lỗi tùm lum, nhưng mà cái cảm giác thấy nó tự động làm được việc mình không tưởng nó vui gì đâu.
Nói chung là mình chỉ mới áp dụng được 1%, còn 99% còn lại phải tối ưu:
- Model dành voice tiếng Việt: Cái này có ElevenLabs và Minimax đang xịn xò nhất. Mấy model giá rẻ thì chịu thua, nói tiếng Việt như robot.
- Tool để AI Agent (dùng Hermes) cắt ghép video hoặc tạo chữ cơ bản thì dùng Remotion hoặc HyperFrame (Heygen).
- Skill: Cái này là quan trọng nhất nè, có model, có agent, có công cụ rồi thì vẫn phải build skill. Ví dụ như Agent lấy tin tức từ đâu, lọc như thế nào? Viết script video sao cho hay? Cắt ghép video như thế nào? Để AI build ra cái video xịn thì skill mỗi người khác nhau.
Nói chung là còn nhiều thứ lắm, nhưng tự vibecode mà ra được mấy cái video thấy cũng đi được 1 bước, còn 99 bước nữa để học tiếp rồi khoe sau nha 😁
Follow @nghienaivn để từng bước master AI workflow
https://t.co/wOX7GsW3qv

🙌 Hãy đặt 1 chân vào 30 cơ hội lớn nhất trong làn sóng AI agent
Nguyên văn bài viết của GREG ISENBERG - Doanh nhân/KOL trên X với 640k followers
Đây là hơn 30 quan sát của mình về những cơ hội lớn nhất trong làn sóng AI agent hiện tại. Có vài ý khiến mình nghĩ mãi không ngủ được.
Người mua mới trên internet đang dần là AI agent. Hãy tưởng tượng hàng tỷ “khách hàng” mới xuất hiện, có tiền để chi tiêu, nhưng chỉ mua qua MCP. Nếu doanh nghiệp không có MCP server, họ gần như vô hình trước lớp người mua mới này.
Mọi hệ thống nhượng quyền đều cần một lớp agent, nhưng hầu như chưa ai có. Riêng ở Mỹ có hơn 30.000 hệ thống nhượng quyền. Mỗi mảng nhượng quyền có thể là cơ hội cho một founder mới.
Một năm trước mọi người nói “phân phối là lợi thế phòng thủ duy nhất”. Bây giờ mình nghĩ phải cộng thêm trí nhớ. Công ty nào vừa có tệp người dùng, vừa giữ được ngữ cảnh tích lũy của agent thì rất khó bị thay thế.
Ứng dụng di động cho người dùng cá nhân đang thú vị trở lại. Trước đây app chủ yếu hiển thị thông tin. Giờ app có thể làm việc thay mình. Làn sóng app trăm triệu đô tiếp theo có thể đang được xây ngay lúc này.
Một ý tưởng rất hay nhưng chưa nhiều người làm là chợ cho thuê agent đã được huấn luyện. Ví dụ một nhà tuyển dụng mất 6 tháng dạy agent tìm ứng viên ngành y tế. Agent đó có thể cho các nhà tuyển dụng khác trong cùng ngành thuê lại. Khi đó, chính agent trở thành sản phẩm.
Một hiện tượng lạ đang xuất hiện: agent bắt đầu có “thói quen xử lý”. Khi giao cùng một việc 100 lần, agent sẽ hình thành cách làm quen thuộc. Chưa nhiều người nghiên cứu chuyện này, nhưng những agent có cách làm tốt sẽ có giá trị hơn agent bình thường.
“Internet chết” có thể sắp thành “SaaS chết”. Nhiều phần mềm sẽ âm thầm thay đội hỗ trợ, đội hướng dẫn người dùng và đội nội dung bằng agent. Người dùng có thể mất nhiều tháng mới nhận ra mình đã không nói chuyện với con người ở công ty đó từ lâu.
Dữ liệu quý nhất hiện nay có thể đang nằm trong các yêu cầu hỗ trợ khách hàng của những công ty SaaS nhỏ và vừa. Mỗi yêu cầu là một lần khách hàng nói thẳng họ cần sản phẩm làm gì tiếp theo.
Một bài toán định giá rất lớn chưa được giải tốt: định giá sản phẩm AI thế nào khi chi phí thay đổi mỗi lần OpenAI hoặc Anthropic đổi giá mô hình? Biên lợi nhuận có thể biến động rất mạnh chỉ vì một quyết định từ nhà cung cấp mô hình. Hạ tầng định giá động cho doanh nghiệp AI agent sẽ là một mảng lớn.
Sản phẩm AI tốt tạo cảm giác như nó đọc được ý mình. Sản phẩm AI tệ tạo cảm giác như mình đang điền thêm một cái biểu mẫu dài hơn.
Một cách khai thác chênh lệch khá thú vị là thuê trợ lý người thật với giá 20 đô/giờ để giám sát một agent đang làm công việc trị giá 200 đô/giờ. Con người chỉ cần kiểm tra đầu ra.
Dịch vụ vận hành AI agent trọn gói đang trở thành mô hình agency mới. Mỗi khách hàng trả 5.000 đô/tháng, bên cung cấp sẽ xây, chạy và bảo trì agent. Khách hàng nhận một “nhân viên số” mà họ không cần tự quản.
Những vụ bê bối “agent bóng tối” đầu tiên có thể sắp xuất hiện. Nhân viên tự chạy agent cá nhân trên hạ tầng công ty, dùng khóa API của công ty, truy cập tài liệu nội bộ mà bộ phận IT không biết. Đây là một vấn đề đau thật sự, không phải nhu cầu xa xỉ.
Có thể đang có hàng triệu agent bị bỏ quên nhưng vẫn chạy. Chúng vẫn đốt token, gửi email, cào dữ liệu web và tiêu tiền mỗi ngày. Một công cụ tìm và tắt “agent xác sống” gần như tự nó đã là một ý tưởng sản phẩm.
Một số công ty bắt đầu tuyển người dựa trên “hồ sơ agent” thay vì CV. Câu hỏi sẽ là: “Cho tôi xem 3 agent bạn đã build và đang chạy thật.” Việc này còn rất sớm, nhưng đã bắt đầu.
Kho tin nhắn Slack của công ty thật ra là một tài sản. Trong đó có hàng ngàn cuộc trao đổi mô tả cách công ty thật sự vận hành. Ai làm được agent đọc lịch sử Slack rồi tự tạo quy trình, tài liệu vận hành và agent mới sẽ có cơ hội rất lớn.
Chi phí tạo ra trí thông minh đang giảm nhanh hơn chi phí phân phối. Điều này có nghĩa phân phối mới là thứ ngày càng đắt.
Một tài sản con người bị đánh giá thấp nhất trong năm 2026 có thể là khả năng ngồi với người khác, nhìn vào mắt nhau và nói chuyện thật. Khi AI xử lý phần giao dịch, những người giỏi xây quan hệ sẽ càng có giá trị.
Sẽ có nhiều công ty lớn được xây quanh một sự thật: rất nhiều agent đang chạy trên máy tính cá nhân, cùng nơi người dùng lướt web, kiểm tra email và tải file linh tinh. Bề mặt tấn công rất rộng. Chỉ cần một tiện ích Chrome độc hại, khóa API, dữ liệu khách hàng và quy trình tự động có thể bị lộ.
Một dạng kiệt sức mới đang hình thành. Nó không đến từ làm quá nhiều, mà đến từ việc chuyển qua lại liên tục giữa việc của người và việc của agent. Xem đầu ra, sửa, duyệt, xem lại. Gánh nặng tinh thần của việc giám sát agent khác với tự làm mọi thứ.
Cách nghiên cứu thị trường rẻ nhất hiện nay là tìm trên Google: “[ngành của bạn] spreadsheet template”. Những gì mọi người còn theo dõi thủ công bằng bảng tính chính là cơ hội sản phẩm.
Nhiều công ty YC đổi hướng rất nhanh sau ngày demo. Không hẳn vì họ thất bại, mà vì agent giúp họ thử 5 ý tưởng trong thời gian trước đây chỉ thử được 1. Khái niệm “gắn bó lâu dài với một ý tưởng” đang yếu dần.
Công việc cô đơn nhất trong ngành công nghệ hiện nay là làm người duy nhất trong công ty hiểu các agent đang làm gì. Không giải thích được cho sếp, không bàn giao được cho đồng nghiệp. Nếu người đó nghỉ, cả hệ thống tự động có thể gãy.
Lịch sử duyệt web có thể là dữ liệu huấn luyện quý nhất mà mình đang sở hữu nhưng lại cho đi miễn phí. Mọi trang đã xem, sản phẩm đã nghiên cứu, đối thủ đã theo dõi, bảng giá đã chụp lại - nếu được cấu trúc và đưa vào agent, nó sẽ hiểu doanh nghiệp sâu hơn rất nhiều.
Ai cũng đang xây lớp bọc AI. Rất ít người xây công cụ tháo lớp bọc AI. Tức là công cụ nhìn vào một tài liệu và chỉ ra phần nào do người viết, phần nào do AI tạo.
Stripe vừa trở thành công ty cực kỳ quan trọng trong nền kinh tế agent mà gần như không cần làm gì thêm. Agent bán hàng cần Stripe. Agent mua hàng cũng cần Stripe. Stripe mặc định trở thành đường ray thanh toán cho internet do agent vận hành.
Một API bị đánh giá thấp hiện nay là API xác minh địa chỉ của Bưu điện Mỹ. Nó gần như miễn phí, nhưng agent tạo khách hàng tiềm năng cho doanh nghiệp địa phương, bất động sản và gửi thư trực tiếp đều cần.
“Giờ làm việc” là khái niệm dành cho con người. Agent của bạn có thể chốt một giao dịch ở Tokyo lúc 3 giờ sáng, xử lý thanh toán, gửi email hướng dẫn bắt đầu và cập nhật CRM trước khi bạn thức dậy.
Điều gì xảy ra khi agent bắt đầu giới thiệu agent khác? Agent nghiên cứu của bạn phát hiện agent bán hàng của đối thủ tốt hơn và đề xuất bạn chuyển sang dùng. Mạng lưới giới thiệu giữa agent đang tự hình thành.
Việc https://t.co/jI0vtHLjr9 đóng mã nguồn là một tín hiệu đáng chú ý. Khi công ty mã nguồn mở bắt đầu đóng lại, nghĩa là agent đã có thể sao chép sản phẩm quá dễ. Nhiều công ty mã nguồn mở đang âm thầm tự hỏi câu tương tự.
“AI cho tiệm chăm sóc thú cưng” nghe như trò đùa, và chính vì vậy nó có thể hiệu quả. Ở Mỹ có khoảng 150.000 tiệm như vậy, hầu như không có công nghệ, vẫn đặt lịch qua điện thoại hoặc tin nhắn Instagram. Những ý tưởng nghe buồn cười nhiều khi lại thắng lớn.
Điều sau này nhìn lại sẽ rất hiển nhiên: chúng ta dành năm 2025–2026 để tranh luận mô hình nào tốt nhất, trong khi phần lớn giá trị thật nằm ở lớp điều phối. Mô hình giống như CPU. Không ai mua máy tính chỉ vì CPU nữa. Người ta mua vì máy đó giúp họ làm được gì.
Ảnh chống trôi, ông mặc đồ con tôm màu đỏ là chủ tịch của quỹ Y Combinator aka Garry Tan - cách đây vài tháng cũng nổi như cồn với bộ skill gstack cho Claude với 97k Star trên Github, đủ cho thấy sức nóng của nền kinh tế AI Agent 😁

Rửa mắt với trang showcase UI/UX sáng tạo 👁️👁️
Trang này có cái hay là gắn luôn link tác giả để anh em liên hệ luôn https://t.co/LxA6D1x0Q2
Còn nhiều showcase ở đây nữa nè @nghienaivn 👇
https://t.co/Kf7vekP7FN
Thư viện animation giúp app/web vibecode không bị đơ!
Nếu đang làm landing page, dashboard, app demo bằng AI, hoặc mấy giao diện cần cảm giác “có motion” hơn một chút, thư viện này có thể dùng cho các hiệu ứng như hover mượt, chuyển cảnh giữa các khối, cursor effect, scroll parallax, hoặc animation SVG.
Cái hay của anime.js là nó giúp mình điều khiển chuyển động trên web một cách có cấu trúc hơn: từ CSS, SVG, DOM attribute cho tới object JavaScript đều có thể animate được.
Website của nó cũng có nhiều demo có code sẵn, khá hợp để học cách người ta nghĩ về motion trên web. Không nhất thiết phải dùng cho mọi project, nhưng nếu đang muốn nâng chất lượng interaction của giao diện thì nên thử qua.
Đường liên kết đâyyy 😁
🔗 https://t.co/JD8bLrgWrq
🔗 https://t.co/zyLCWJej6C
----
Ôi cái này hay quá, anh em thích khám phá 3D xem thử 🤖🦾🦿
Articraft là AI tạo model 3D có khớp chuyển động
Ví dụ: laptop có màn hình gập mở, kéo có hai lưỡi xoay, tủ có cánh cửa, robot có tay chân. Articraft không chỉ tạo hình dáng, mà còn chia vật thể thành các phần, xác định khớp, trục xoay và chuyển động.
Điểm hay là nó hoạt động như một coding agent: viết code tạo asset 3D → chạy thử → nhận phản hồi → sửa tiếp nên asset tạo ra thường sạch, nhẹ, có cấu trúc rõ và dễ đưa vào mô phỏng robot/physics hơn.
Articraft-10K cũng có 10.000+ vật thể 3D có khớp, phục vụ robotics simulation và physical AI....
🔗 Repo
https://t.co/FLK78HUtsR
https://t.co/hvUEbLmV5h
👍 Follow @nghienaivn để học thêm nhiều thứ hay
https://t.co/wOX7GsW3qv
---
Build iOS app bằng tính năng /goal của Codex
Đây là mode dành cho các task dài hơi, nơi AI không chỉ trả lời một lần rồi dừng, mà có thể tự theo đuổi một mục tiêu qua hàng giờ làm việc. Ví dụ như ship một release, fix CI cho tới khi xanh hoàn toàn, audit cả repo hoặc build nguyên một app từ đầu tới cuối.
Có thể bật bằng: [features]
goals = true
Tác giả kevinkern trên X bắt đầu bằng GPT Thinking để brainstorm ý tưởng, sau đó chuyển sang GPT Pro để viết full app spec. Nếu muốn Codex chạy liên tục trong nhiều giờ mà không bị lệch hướng, trước tiên phải có một bản đặc tả sản phẩm đủ rõ.
Sau khi hoàn thành spec, GPT Pro export toàn bộ thành file .zip rồi handoff sang Codex.
Tiếp theo là phần context và skills.
Để Codex hiểu rõ ecosystem iOS hơn, tác giả dùng thêm nhiều skill/MCP hỗ trợ. Đây là phần rất quan trọng vì Codex không chỉ cần “biết code Swift”, mà còn phải hiểu cách vận hành cả môi trường iOS development.
✅ xcodebuildmcp là bridge giúp Codex điều khiển Xcode và iOS Simulator, do @camsoft2000 tạo. Nhờ layer này, Codex có thể tự build app, chạy simulator và thao tác trong môi trường iOS thật thay vì chỉ generate code tĩnh.
✅ ios/swiftui là skill cho vòng lặp triển khai app iOS bằng SwiftUI, gồm build app, debug simulator và các best practice, do @Dimillian tạo. Có thể hiểu đây giống một “workflow layer” giúp Codex hiểu cách app iOS nên được build như thế nào.
✅ asc hay App Store Connector CLI là skill hỗ trợ App Store Connect, giúp submit app, release và phân phối lên TestFlight/App Store, shoutout @rudrank. Đây là layer giúp Codex không dừng ở việc code app, mà bắt đầu chạm tới cả quy trình release thật.
Sau khi đã có spec và context đầy đủ, tác giả chỉ đưa cho Codex đúng một lệnh: /goal read all the files in docs/*.md, implement everything production ready and don't stop until its landed in testflight
Tức là đọc toàn bộ tài liệu trong thư mục docs, build mọi thứ ở mức production-ready và đừng dừng lại cho tới khi app lên được TestFlight.
Sau khoảng 3 tiếng, app gần như hoàn thành và Codex dừng ở bước submit TestFlight. Phần còn lại chủ yếu là setup tài khoản Apple và giấy tờ thủ công.
Codex tự:
- đọc spec
- implement app
- chạy simulator
- inspect UI
- test flow
- review output
- fix bug
- retry
- verify app hoạt động
Tức là vòng lặp hiện tại gần như đã trở thành: inspect → implement → test → review → fix và lặp liên tục cho tới khi ship được app.
Ngoài /goal, Codex còn có thêm /side. Đây là mode cho phép mở một context phụ ngay trong cùng cửa sổ để brainstorm hoặc hỏi thêm mà không làm loãng context chính. Ví dụ tác giả dùng /side để hỏi thêm về App Store Connect, design system và cách cải thiện app. Sau đó chỉ cần bấm ESC là quay lại main thread đang build app.
Follow @nghienaivn - mục tiêu build được cái app thành công 😁
https://t.co/wOX7GsW3qv
----
🧠 Từ sách đến bản đồ tri thức
Mình vừa đọc một ý khá hay của ông tác giả poetengineer__ trên X nói là có thể chúng ta đang hiểu “sách” quá hẹp.
Phần lớn mọi người hiện tại xem sách như một chuỗi chữ đọc từ đầu tới cuối. Mở sách ra, đọc từng trang, lấy thông tin, ghi chú vài ý hay rồi chuyển sang cuốn khác. Cách đọc này tiện, nhưng nó khiến mình nhìn tri thức như một dòng thẳng.
Trong khi nhiều hệ tri thức cổ không vận hành như vậy.
Ví dụ như Talmud hay nhiều kinh điển Trung Hoa cổ, phần văn bản gốc thường chỉ là một lớp ở trung tâm. Xung quanh nó là chú giải, phản biện, diễn giải và tranh luận của rất nhiều thế hệ khác nhau. Người đời sau không xoá lớp cũ để viết lại từ đầu. Họ thêm một lớp mới lên trên, đặt suy nghĩ của mình cạnh suy nghĩ của người trước.
Những cuốn sách đó giống một “cảnh quan tri thức” hơn là một văn bản tuyến tính.
Đây là insight mình thấy rất hay, tri thức giá trị không chỉ nằm trong nội dung gốc. Nó nằm trong cách con người diễn giải nội dung đó, cách các ý tưởng nối với nhau, cách mỗi thế hệ tranh luận với thế hệ trước, và cách nhiều lớp suy nghĩ chồng lên nhau theo thời gian.
Nó giống một bản đồ, trên bản đồ đó, mỗi ý tưởng là một điểm. Mỗi chú giải là một lớp. Mỗi tranh luận là một đường nối. Mỗi thế hệ người đọc lại thêm vào một cách hiểu mới.
Mình nghĩ đây cũng là hướng mà internet, AI và các hệ thống quản lý tri thức đang đi tới.
Chúng ta đang dịch chuyển từ việc đọc từng tài liệu riêng lẻ sang việc khám phá một không gian tri thức có liên kết. Đó là lý do những thứ như wiki graph, knowledge graph, linked notes, RAG, graph memory hay AI có ngữ cảnh dài đang trở nên quan trọng hơn.
Nghe tính năng này thấy khá giống NotebookLM, nhưng NotebookLM chưa trực quan quán để phóng to, thu nhỏ, bấm vào từng điểm, hỏi thêm, tranh luận, xem các lớp diễn giải cũ trên các file thông tin.
Hóng các vibecoder build app này, ý tưởng hay 😁
Follow @nghienaivn để growth hack cùng với AI!
https://t.co/wOX7GsW3qv
----


✅ Cách set up giúp Codex "online" 24/7
Mình vừa thấy một cách setup khá thú vị của ông tác giả trên X (nickbaumann) biến Mac mini thành “nhà chính” cho Codex, còn laptop và điện thoại chỉ đóng vai trò như thiết bị vệ tinh để truy cập vào đó.
Thay vì để Codex phụ thuộc vào cái laptop đang mở trước mặt, ổng để một chiếc Mac mini luôn bật, luôn cắm mạng, luôn có môi trường dev sẵn.
Khi cần mở thread mới từ điện thoại, ổng cho chạy trên Mac mini. Khi ngồi bàn làm việc, ổng cũng dùng Mac mini. Khi ra ngoài họp, ổng vẫn có thể tiếp tục thread đó trên MacBook.
Điểm hay là MacBook và Mac mini được kết nối với nhau. Thread có thể bắt đầu ở máy này, rồi tiếp tục ở máy khác. File cũng được nối qua SSH hai chiều, nên việc truy cập qua lại dễ hơn. Chưa mượt hoàn toàn, nhưng vấn đề này sẽ cải thiện được.
Kết quả là ổng có một Codex gần như online 24/7, có môi trường dev riêng, có thể mở từ điện thoại, tiếp tục từ laptop, hoặc chạy trực tiếp trên Mac mini ở nhà.
Codex bắt đầu không còn là thứ gắn với “cái máy tính mình đang mở”. Nó giống một lớp làm việc chạy nền hơn. Điện thoại, laptop, desktop chỉ là các cửa sổ để truy cập vào lớp đó.
Trước đây, mỗi thiết bị gần như là một workspace riêng.
Nhưng với AI agent, tương lai có thể sẽ khác, mỗi người có một lớp compute/workspace luôn chạy 24/7, còn thiết bị chỉ là terminal để điều khiển.
Laptop không còn là trung tâm. Agent mới là môi trường làm việc thật sự.
Follow @nghienaivn để biết thêm nhiều tips hay!
https://t.co/wOX7GsW3qv

🔥 Elon Musk tiết lộ thuật toán đẩy bài viết trên X
Đây là lần hiếm hoi chúng ta được nhìn khá gần vào cách một mạng xã hội lớn sắp xếp nội dung cho mục “Dành cho bạn”. Trước giờ ai cũng biết là X có thuật toán chọn bài, nhưng nó hoạt động cụ thể ra sao thì phần lớn chỉ có thể đoán.
Link repo
https://t.co/Pq6bFzKTcl
Hiểu ngắn gọn thì khi bạn mở X, hệ thống sẽ phải làm vài việc cùng lúc. Trước tiên, nó lấy những bài mới từ những người bạn đã theo dõi. Nhưng nếu chỉ có vậy thì feed sẽ không hấp dẫn lắm, nên hệ thống còn phải đi tìm thêm những bài ở ngoài mạng lưới của bạn, tức là những người bạn chưa follow nhưng có khả năng bạn sẽ thấy thú vị.
Sau khi gom được một đống bài như vậy, hệ thống chưa thể đẩy thẳng lên feed. Nó còn phải đọc thêm rất nhiều tín hiệu xung quanh bạn và xung quanh từng bài viết.
Ví dụ như bạn từng thích nội dung gì, thường dừng lại lâu ở kiểu bài nào, có chặn hoặc ẩn ai không, có quan tâm chủ đề nào không, bài đó có phải video không, có phải quảng cáo không, có vi phạm gì không, đã từng hiện ra trước mắt bạn chưa.
Phần thông minh nhất trong repo này nằm ở chỗ chấm điểm các bài viết. Hệ thống sẽ cố dự đoán xem nếu hiện bài này lên thì bạn có khả năng bấm thích không, có bình luận không, có chia sẻ không, có bấm vào xem tiếp không, hay chỉ lướt qua. Mỗi kiểu hành động như vậy đều được tính như một tín hiệu.
Sau đó, hệ thống cộng các tín hiệu đó lại theo trọng số để quyết định bài nào nên được ưu tiên hơn. Nghĩa là nó không chỉ hỏi “bài này hay không”, mà hỏi cụ thể hơn: “bài này có làm người dùng thực sự tương tác không”.
Ngoài phần mô hình máy học, hệ thống vẫn có rất nhiều lớp lọc và sắp xếp thủ công để feed trông hợp lý hơn. Ví dụ, nó sẽ tránh hiện đi hiện lại quá nhiều bài từ cùng một người, tránh nhét những nội dung bạn đã xem, tránh những bài có vấn đề về an toàn nội dung, và còn phải chừa chỗ để trộn quảng cáo hay gợi ý tài khoản nên theo dõi.
Một điểm rất đáng chú ý nữa là thuật toán này không chỉ làm một việc theo kiểu từ đầu tới cuối, mà được chia thành nhiều phần riêng.
- Có phần chuyên lo lấy bài từ người bạn theo dõi.
- Có phần chuyên đi tìm bài mới ngoài mạng lưới.
- Có phần chuyên chấm điểm.
- Có phần chuyên lọc bớt những thứ không nên hiện.
- Có phần chuyên trộn tất cả lại thành feed cuối cùng.
Cách chia như vậy giúp hệ thống vừa nhanh, vừa dễ mở rộng, vừa dễ chỉnh nếu muốn thay đổi một khâu nào đó.
Thuật toán hiểu đơn giản là một hệ thống cố gắng học từ hành vi của bạn, rồi liên tục thử đoán xem điều gì sẽ giữ bạn ở lại lâu hơn.
Càng dùng nhiều, nó càng có thêm dữ liệu để đoán tốt hơn. Vì vậy đôi khi cảm giác “sao nó hiểu mình quá” thực ra đến từ việc nó đã quan sát rất nhiều thói quen nhỏ của mình trong thời gian dài.
Follow @nghienaivn để bắt kịp mọi thứ về AI!
https://t.co/wOX7GsW3qv
----

Wow trước, làm được hay không tính sau 😂
Clickbait xíu thôi nhưng bữa giờ đang hot cái vụ sử dụng slide HTML, mình dùng cái này khá thường xuyên để tạo slide vì nó nhanh (trong trường hợp bạn không cần phải thêm ảnh vào slide nhiều, nếu cần thì Gg Slides với Canva vẫn tối ưu hơn).
Nhưng cái quan trọng là nhiều chỉ sử dụng HTML tĩnh nhưng thực tế là AI có thể làm HTML slide có thể tương tác rất linh hoạt như video dưới đây.
Cái interactive đó vẫn là HTML, nhưng chính xác hơn thì nó là một “web app nhỏ” chạy bằng HTML + CSS + JavaScript.
Nhiều người nhìn mấy architecture map kiểu này hay tưởng nó là một phần mềm riêng hoặc canvas phức tạp, nhưng thực ra phần lớn đều chỉ là web.
🖱️ Cái video dưới đây thực chất là:
- HTML để dựng layout
- CSS để tạo style, màu sắc,...
- JavaScript để xử lý tương tác
- Có thể thêm SVG hoặc Canvas để vẽ line connection
Nếu biểu đồ visual phức tạp hơn thì dùng React hoặc D3.js
✍️ Cách prompt là:
Hãy tạo một trang HTML tương tác dạng architecture flow map trong một file duy nhất, dùng HTML/CSS/JavaScript, SVG để vẽ đường nối giữa các box, có thể dùng D3.js hoặc React Flow nếu graph phức tạp, dùng Framer Motion hoặc CSS transition để tạo motion mượt. Bố cục gồm vùng chính hiển thị các node/box và flow, panel bên phải để giải thích chi tiết. Khi click vào từng box hoặc flow, hãy highlight các node liên quan, làm mờ phần không liên quan, đổi màu đường nối đang chọn và cập nhật panel với mô tả, input, output, các bước xử lý và rủi ro. Xuất kèm JSON gồm nodes, edges, flows, steps để AI agent khác có thể đọc lại cấu trúc hệ thống.
Nói chung các bạn không cần prompt giống 100% đâu, quan trọng là hiểu để tạo ra được thành phẩm như vậy cần stack gì, sau đó hỏi AI nhờ nó gợi ý => bạn check 1 phát để kiểm tra lại rồi kêu AI làm test để feedback từ từ.
Follow @nghienaivn vì chắc chắn bạn sẽ cần AI 😁
https://t.co/wOX7GsW3qv
---
🖼️ Manh mối để tự build mấy app 3D vibecode cực xịn
Đây là tác phẩm của ông @DilumSanjaya trên X, tất nhiên là hàng xịn thì giấu nghề hoặc bán chứ ổng không share free.
Nhưng mình lục tung comment cũng có vài manh mối để tìm hiểu về quy trình nhiều lớp 👇
"Vibecoder và khoản nợ 300 triệu" - Đừng lao vào AI như con thiêu thân!
Mặc dù bài viết chỉ là kể chuyện nhưng phần giá trị nhất nằm ở comment của những người đã đi trước trên con được code build sản phẩm.
Đây chính là vibe của một cộng đồng thực sự, cực kỳ nhiều chia sẻ giá trị 👇
https://t.co/Y4f6b1DnUT
----

🔥 Hãy dùng token thông minh hơn để còn tiền đi du lịch!!!
Nhiều người nghĩ dùng AI tốn tiền chủ yếu vì model đắt. Nhưng thực ra phần lớn chi phí đến từ cách chúng ta dùng context và workflow.
Tip đầu tiên là đừng viết prompt như đang nhắn tin với con người. AI không cần “em chào anh”, “anh giúp em với”, hay kể quá nhiều câu chuyện không liên quan. Nó cần mục tiêu, dữ liệu và format đầu ra rõ ràng. Một prompt kiểu “viết cho tôi 5 ý chính ngắn gọn” thường rẻ hơn rất nhiều so với việc để model tự suy diễn bạn muốn gì.
Chỗ này nhiều anh em không phân biệt rõ system prompt vs user prompt nên prompt không rõ ràng nè 👀
Tiếng Anh cũng thường tiết kiệm token hơn tiếng Việt. Vì tokenizer của đa số model hiện tại tối ưu cho tiếng Anh tốt hơn. Nhưng thật ra chỗ này không quan trọng lắm.
Chỗ quan trọng là nhiều lúc khi gửi prompt cho 1 AI khác, đặc biệt là AI gen ảnh thì bạn nên kêu nó dịch lại tiếng Anh rồi gửi thì kết quả ra sẽ chính xác hơn!
Đừng paste cả tài liệu dài nếu chỉ cần AI đọc một phần nhỏ. Context window không thông minh theo kiểu “tự bỏ qua phần thừa”. Model vẫn phải đọc toàn bộ token được gửi vào. Đây là lý do nhiều app AI RAG phải chunk dữ liệu và retrieval đúng đoạn thay vì nhét nguyên PDF vào context.
Một lỗi rất phổ biến là conversation quá dài. Mỗi lần chat tiếp, model thường phải đọc lại phần lớn context cũ. Một thread vài chục nghìn token sẽ làm cost tăng rất nhanh. Với workflow dài, nên reset thread định kỳ hoặc tóm tắt lại context thành memory ngắn hơn.
Khi code, đừng gửi cả codebase nếu chỉ sửa một hàm. Hãy gửi đúng file hoặc đúng đoạn liên quan. Ví dụ “fix function này”, “đây là component đang lỗi”, “chỉ output phần diff” sẽ tiết kiệm hơn rất nhiều so với chụp màn hình lỗi rồi hỏi “có bug gì không”.
Một tip rất mạnh trong production là dùng prompt cache. Nhiều app AI hiện đại tách:
- system prompt cố định
- memory dài hạn
- query hiện tại
System prompt và memory ổn định sẽ được cache lại thay vì gửi lại toàn bộ mỗi request. Với app nhiều user hoặc agent workflow dài, cache có thể giảm chi phí cực mạnh.
Output token cũng tốn tiền, không chỉ input. Nhiều người tối ưu input nhưng để AI trả lời 3.000 từ cho một task đơn giản. Nếu chỉ cần JSON thì yêu cầu “chỉ output JSON”. Nếu chỉ cần code thì ghi “không giải thích”. Với coding agent, phần output đôi khi còn đắt hơn input.
Đừng dùng model mạnh nhất cho mọi thứ. GPT-5.5 hoặc Claude Opus để rewrite một tiêu đề ngắn là khá phí. Workflow tốt thường dùng model nhỏ cho task đơn giản và chỉ gọi model lớn ở bước reasoning quan trọng.
Thực ra phần lớn mình dùng Claude Sonnet, GPT 5.4 là reasoning cũng tốt lắm rồi. Tác vụ thường ngày dùng mấy model Trung Quốc qua Ollama Cloud API như Deepseek, GLM, Minimax xài tẹt ga.
Một điều ít anh em chú ý là prompt rõ ngay từ đầu thường rẻ hơn rất nhiều so với chat qua lại nhiều vòng. Một prompt tốt có thể tốn 2.000 token. Nhưng 10 lần sửa prompt nhỏ có thể tốn 20.000–30.000 token rất nhanh vì nó phải đọc lại context cũ nhiều.
Với AI agent, cách tiết kiệm lớn nhất thường không nằm ở prompt, mà nằm ở architecture. Nếu agent liên tục đọc lại toàn bộ memory, toàn bộ docs, toàn bộ chat history mỗi bước thì chi phí sẽ nổ rất nhanh. Đây là lý do các hệ agent production phải dùng retrieval, memory layer, context pruning và state management thay vì nhét mọi thứ vào context window.
Cuối cùng, workflow AI tốt không phải workflow dùng model mạnh nhất hay context dài nhất. Nó là workflow đưa đúng dữ liệu, đúng lúc, cho đúng model.
Follow @nghienaivn đảm bảo có nhiều bài chất lượng!
https://t.co/wOX7GsW3qv ✅
---

Những người làm sản phẩm thường chỉ tập trung vào “vật thể sáng bóng” - tức sản phẩm họ đang xây rồi quên mất toàn bộ hành trình còn lại cho đến sát lúc giao cho khách hàng.
Nhưng khách hàng thì nhìn thấy tất cả, trải nghiệm tất cả. Chính họ mới là người đi qua hành trình đó, từng bước một.
Tony Fadell (Phó chủ tịch bộ phận iPod tại Apple Inc. và là người sáng lập kiêm cựu CEO của Nest Labs)
@nghienaivn

Skill quan trọng nhất là skill "Tạo skill phù hợp với mình" 💯
🧠 Google rót 40 tỷ cho Anthropic, Anthropic thuê GPU từ SpaceX. Ý nghĩa đằng sau là gì?
Google được Reuters đưa tin sẽ đầu tư tối đa 40 tỷ USD vào Anthropic, trong đó 10 tỷ USD là khoản tiền mặt ban đầu ở mức định giá khoảng 350 tỷ USD, còn 30 tỷ USD còn lại phụ thuộc vào các mốc hiệu suất. Cùng thời điểm đó, Anthropic ký thỏa thuận dùng toàn bộ compute capacity tại Colossus 1 của SpaceX/xAI ở Memphis, Tennessee, với hơn 220.000 GPU NVIDIA và khoảng 300MW công suất tính toán.
Nhìn vào các con số này sẽ thấy Anthropic đang bước vào một giai đoạn rất khác. Claude đang trở thành một hạ tầng AI được developer, doanh nghiệp và người dùng cá nhân gọi liên tục mỗi ngày. Theo Reuters, annual run-rate revenue của Anthropic đã vượt 30 tỷ USD vào tháng 4/2026, tăng từ khoảng 9 tỷ USD cuối năm 2025. TechCrunch còn dẫn nguồn nói con số này đang tiến gần 40 tỷ USD.
Khi Claude Code, Claude Pro/Max và API tăng trưởng nhanh như vậy, bài toán vận hành bắt đầu chuyển từ “làm model hay hơn” sang “có đủ hạ tầng để phục vụ nhu cầu hay không”.
Theo xAI, cụm Colossus 1 này có hơn 220.000 GPU NVIDIA, gồm H100, H200 và GB200. Reuters nói Colossus 1 đem lại khoảng 300MW capacity cho Anthropic. Để dễ hình dung, 300MW là quy mô hạ tầng cấp công nghiệp, giống một nhà máy điện nhỏ phục vụ riêng cho AI, bao gồm GPU, điện, làm mát, mạng nội bộ tốc độ cao, storage, datacenter và đội vận hành 24/7.
Con số 220.000 GPU cũng cho thấy mức độ “đốt vốn” của cuộc đua AI hiện tại. Tính rất thô, nếu lấy trung bình 40.000 USD/GPU để dễ hình dung, riêng tiền GPU đã khoảng 8,8 tỷ USD. Nếu lấy biên 30.000–70.000 USD/GPU, phần chip có thể nằm trong vùng 6,6–15,4 tỷ USD. Con số này còn chưa tính server, networking, storage, điện, làm mát, đất, xây datacenter và chi phí vận hành.
Điểm thú vị nằm ở chỗ SpaceX/xAI cũng có Grok và cũng đang chạy cuộc đua AI riêng, nhưng vẫn cho Anthropic thuê Colossus 1. Elon Musk nói SpaceX đã chuyển hoạt động AI training của mình sang Colossus 2 và sẵn sàng cung cấp compute cho các công ty AI khác nếu cùng định hướng.
Đọc theo góc độ incentive thì động thái này rất đáng suy nghĩ. Nếu xAI/SpaceX sẵn sàng cho Anthropic thuê một cụm compute lớn như vậy, nghĩa là họ đánh giá dòng tiền từ deal này đáng giá hơn việc dùng toàn bộ Colossus 1 cho model nội bộ.
Có hai khả năng dễ hiểu: hoặc Anthropic trả premium rất cao để mua capacity ngay lập tức, hoặc xAI nhìn thấy việc cho thuê GPU tạo lợi tức tốt hơn so với tiếp tục dồn toàn bộ compute vào cuộc đua model ở thời điểm này.
Sau khi xAI được gắn chặt hơn vào hệ sinh thái SpaceX, GPU bắt đầu giống một tài sản hạ tầng tạo dòng tiền hơn là tài sản phải giữ kín để bảo vệ định giá của một AI lab độc lập. Nói dễ hiểu, nếu Colossus 1 có thể cho thuê với giá tốt, nó trở thành business line kiểu cloud. Câu chuyện này khá giống AWS thời đầu, khi Amazon xây hạ tầng cho chính mình rồi phát hiện cho người khác thuê hạ tầng có thể trở thành một mảng kinh doanh khổng lồ.
Anthropic cũng đang gom compute từ rất nhiều phía chứ không đặt toàn bộ cược vào SpaceX. Họ có quan hệ hạ tầng với Google, Amazon, NVIDIA/Azure, Broadcom, CoreWeave, Fluidstack và giờ thêm SpaceX/xAI. Reuters cho biết Anthropic đã có các thỏa thuận lớn với Broadcom, CoreWeave, gần 1GW capacity qua chip Amazon trước cuối năm và kế hoạch đầu tư 50 tỷ USD để xây data center tại Mỹ. Reuters cũng dẫn lại The Information rằng Anthropic có thể cam kết chi khoảng 200 tỷ USD trong 5 năm cho Google Cloud và chip.
Google trong ván này cũng rất đáng chú ý. Họ có Gemini để cạnh tranh trực tiếp với Claude, nhưng vẫn đầu tư vào Anthropic và bán hạ tầng cho Anthropic. Gemini thắng thì Google thắng ở model layer. Anthropic thắng thì Google vẫn hưởng lợi qua vốn đầu tư, cloud và chip. Đây là cách các ông lớn cloud chơi nhiều cửa trong cuộc đua AI: vừa tự xây model, vừa bán hạ tầng cho những công ty có khả năng trở thành người thắng.
Với Anthropic, việc gom compute từ nhiều nguồn là một chiến lược sinh tồn. Dùng nhiều cloud, nhiều loại chip và nhiều nhà cung cấp sẽ khiến vận hành phức tạp hơn rất nhiều, nhưng đổi lại họ giảm rủi ro bị khóa vào một bên duy nhất. Trong AI frontier, phụ thuộc vào một cloud, một loại chip hoặc một lịch giao GPU có thể trở thành điểm nghẽn rất lớn, vì chỉ cần thiếu capacity là sản phẩm bị nghẽn ngay.
Mình nghĩ đây là điểm nhiều người mới nhìn AI dễ bỏ qua. SaaS truyền thống scale bằng code, cloud và sales. Frontier AI scale bằng GPU, điện, datacenter, cooling, networking và những hợp đồng hạ tầng hàng chục đến hàng trăm tỷ USD.
Cuộc đua AI đang bước sang giai đoạn compute war. Công ty thắng sẽ cần model tốt, đủ GPU, đủ điện, đủ datacenter, đủ vốn và đủ khả năng kiểm soát dependency hạ tầng để biến model đó thành sản phẩm chạy ổn định cho hàng trăm triệu người dùng.
"The future currency is essentially wattage." - Elon Musk
Follow @nghienaivn để làm chủ AI sớm nhất 👇
https://t.co/wOX7GsW3qv

AI không khó, nó chỉ mới với chúng ta 💪
Các bạn hãy tin vào điều này. Rất nhiều bạn nhắn tin hỏi mình bây giờ nên bắt đầu từ đâu? Mình có dạy cho người mới không?...
Thú thật là mình cũng mới tìm hiểu AI được 2 tháng thôi, bắt đầu từ con số 0 đúng nghĩa nhưng cũng đã tăng được x2 năng suất nhờ AI. Từ một người không biết terminal là gì, bây giờ cũng làm xong 1 cái website với tên miền hoàn chỉnh.
Mọi người không thiếu tài liệu hay thiếu người dạy. Cái mọi người thiếu đôi khi chỉ là sự xông pha. AI bây giờ "toàn năng" lắm, bạn dám hỏi, nó dám trả lời. Đôi khi nó trả lời sai khiến bạn mất thời gian, nhưng đâu có sao, đó vẫn là trải nghiệm.
Nhớ có lần mình muốn cài Openclaw để điều khiển máy nhưng AI cài vào Docker khiến "con tôm" bị nhốt trong lồng không làm gì được. Nhưng cũng nhờ vụ này mình mới hiểu thêm về Docker, biết cách dùng Terminal...
Hôm nay có bạn nhắn mình "Em muốn dùng AI làm video trên TikTok thì nên bắt đầu thế nào?". Thực sự mình không biết phải trả lời thế nào vì làm 1-2 video chơi thì khác mà muốn sản xuất hàng loạt thì khác, video ghép footage thì khác mà video AI gen 100% lại khác.... Với những câu hỏi này, còn ai có thể trả lời bạn chi tiết hơn AI?
Nếu như trước đây là không biết hỏi ai, không biết bắt đầu từ đâu thì bây giờ phải là bắt đầu từ nhu cầu chính mình + không biết gì thì đè AI ra mà hỏi cho đến khi xong việc thì thôi.
First Principle Thinking + AI First Thinking + Xông pha lên đừng đợi người khác dẫn dắt 🔥 => Không tới được Đại học thì cũng sẽ qua được Tiểu học thôi 😁
Nếu hỏi AI hoài mà vẫn chưa ra thì hỏi ở đây, có nhiều cao thủ ẩn danh lắm @nghienaivn
🟠 https://t.co/wOX7GsW3qv
-----

🔴 [Livestream] Code with Claude
🦉 Link cho cú đêm không chịu đi ngủ: https://t.co/9pdG2KPDFk
Còn anh em nào buồn ngủ quá thì ngủ đi, mai mình recap lại chi tiết cho 😁

🖼️ GPT Image 2 đang vô đối trong việc tạo ảnh
Nhưng nếu bạn chưa có ý tưởng, chưa biết cách prompt hãy tham khảo từ web này
- Tạo bộ nhận diện cơ bản cho logo
- Tạo ảnh 3D từng bộ phận trong sản phẩm (Cái này tạo - 10 ảnh xong nhờ Google Flow tạo thành video để làm thành landing page có hiệu ứng tách rời từng bộ phận được nè)
- Mô phỏng mặt bằng, căn hộ,...
- Ảnh ghép nhân vật và sản phẩm quảng cáo trên sàn TMĐT
✅ Link cho mọi người trải nghiệm, rất nhiều repo và nhiều bên tổng hợp prompt
- https://t.co/pIjAdlCqTg
- https://t.co/qVAmFHh7H0
- https://t.co/qslpuD6K74
- https://t.co/V3T4bvhUcd
- https://t.co/8g01bFVdCZ
- https://t.co/1xtJuMu6b5
Follow @nghienaivn để trải nghiệm nhiều tips hay nhất với AI
🟠 https://t.co/wOX7GsW3qv
----




✍️ Nếu muốn trở thành kỹ sư AI, hãy học những thứ sau
Theo lời khuyên của Kỹ sư Phần mềm tại Atlassian
🟠 Prompt caching & semantic caching
Khi build AI production thật sự, vấn đề lớn nhất thường không còn là “model có thông minh không”, mà là hệ thống có chạy đủ nhanh và đủ rẻ không.
Đó là lý do caching (lưu sẵn kết quả cũ) gần như bắt buộc. Prompt caching hoạt động kiểu: prompt giống hệt → trả lại kết quả cũ thay vì gọi model suy nghĩ lại từ đầu.
Semantic caching nâng cấp hơn một chút. Hệ thống sẽ cố hiểu xem hai câu có cùng ý nghĩa hay không. Ví dụ: “RAG là gì?” và “RAG hoạt động như thế nào?" có thể dùng chung cache dù câu chữ khác nhau.
Điểm đánh đổi nằm ở chỗ cache càng mạnh thì càng nhanh và rẻ, nhưng cũng càng dễ lấy nhầm ngữ cảnh hoặc dùng lại output cũ không còn phù hợp.
🟠 KV cache management
KV cache (bộ nhớ tạm của model) là một trong những lý do ChatGPT trả lời nhanh như hiện tại.
Khi AI đang generate từng token, nó không muốn đọc lại toàn bộ context từ đầu mỗi lần viết thêm một chữ mới. KV cache giúp model lưu sẵn “trạng thái suy nghĩ” trước đó để tái sử dụng.
Hiểu đơn giản giống như bạn đang đọc sách và dùng bookmark thay vì mỗi lần đọc tiếp lại mở từ trang 1.
Nhưng KV cache rất tốn VRAM. Context càng dài thì cache càng lớn. Khi có hàng triệu user dùng cùng lúc, việc quản lý memory (bộ nhớ), batching (gom request) và GPU efficiency (hiệu suất GPU) trở thành bài toán cực khó.
🟠 Speculative decoding vs quantization
Đây là hai kỹ thuật tối ưu inference (quá trình AI tạo output) phổ biến nhất hiện nay.
Speculative decoding hoạt động kiểu model nhỏ “viết nháp” trước, sau đó model lớn chỉ cần kiểm tra lại thay vì tự suy nghĩ toàn bộ từ đầu. Giống như intern làm draft rồi senior review lại.
Quantization là kỹ thuật nén model để giảm VRAM và chạy nhanh hơn trên GPU yếu hoặc máy local.
Tradeoff là model càng nhẹ thì càng rẻ và dễ deploy, nhưng đôi khi reasoning (khả năng suy luận) và chất lượng output cũng giảm theo.
Còn tiếp 👇

💯 [Giải ngố] RAG có thực sự thần kỳ không mà ai cũng tung hô?
RAG (Retrieval-Augmented Generation) đang là công nghệ xuất hiện khắp nơi trong AI doanh nghiệp, từ chatbot đọc PDF cho tới AI kết nối Notion, CRM hay dữ liệu nội bộ.
Nhưng thực ra RAG không làm AI “thông minh hơn thần kỳ”. Nó đơn giản là cơ chế giúp AI “search trước rồi mới đọc”.
Bình thường, các model như ChatGPT chỉ trả lời dựa trên dữ liệu đã được train sẵn. Nó không tự biết file PDF mới upload hay tài liệu nội bộ công ty. RAG giải quyết chuyện đó bằng cách cắt tài liệu thành nhiều đoạn nhỏ, biến chúng thành embedding vectors rồi lưu vào vector database. Khi user hỏi, hệ thống sẽ search những đoạn liên quan nhất rồi đưa vào context window để AI đọc trước khi trả lời.
Điểm quan trọng là AI không đọc toàn bộ dữ liệu. Nó chỉ đọc vài đoạn được retrieval system lấy ra tại thời điểm query.
Đây là lý do RAG cực kỳ quan trọng trong thực tế. Vì context window hiện tại vẫn hữu hạn và token rất đắt.
Một công ty có thể có hàng triệu ticket support, hàng chục nghìn file PDF hay hàng GB dữ liệu nội bộ nên gần như không thể nhét toàn bộ vào context mỗi lần AI trả lời.
RAG hoạt động như một lớp “bộ nhớ tìm kiếm”, giúp AI chỉ đọc đúng phần cần thiết. Nhưng đây cũng là điểm yếu lớn nhất của nó. Nếu retrieval search sai tài liệu, thiếu context hoặc lấy chưa đủ thông tin thì AI vẫn trả lời sai dù model phía dưới rất mạnh.
Đó là lý do phần khó nhất của RAG thường nằm ở retrieval engine phía trước model, chứ không phải bản thân LLM.
Để RAG hoạt động hiệu quả, phía dưới phải tối ưu rất nhiều thứ:
- Chunk Size: Kích thước mỗi đoạn text sau khi cắt. Chunk quá nhỏ thì mất context, chunk quá lớn thì retrieval kém chính xác và tốn token hơn.
- Overlap Between Chunks: Phần nội dung chồng lên nhau giữa các chunk để tránh mất ý khi một đoạn văn nằm giữa ranh giới hai chunk.
- Embedding Model: Model dùng để biến text thành vector ý nghĩa. Embedding càng tốt thì khả năng tìm đúng tài liệu càng cao.
- Reranking: Sau khi retrieval lấy ra nhiều đoạn liên quan, reranker sẽ chấm điểm lại để chọn vài đoạn thực sự phù hợp nhất trước khi đưa vào LLM.
- Metadata Filtering: Lọc tài liệu theo thời gian, phòng ban, loại file, user hoặc quyền truy cập để retrieval chính xác hơn.
- Hybrid Search: Kết hợp semantic search và keyword search để vừa hiểu nghĩa vừa không bỏ sót exact keyword quan trọng.
- Retrieval Strategy: Logic quyết định cách search, lấy bao nhiêu chunk, search bao nhiêu vòng hay có dùng agent query expansion hay không.
Thực tế hiện nay, nhiều AI doanh nghiệp mạnh hơn không hẳn vì model tốt hơn. Họ mạnh hơn vì retrieval system, context engineering và orchestration phía sau tốt hơn.
RAG không phải phép màu. Nó là bài toán “đưa đúng context vào đúng thời điểm” và đó đang là một trong những khó khăn lớn nhất của AI hiện đại.
Follow @nghienaivn để update kiến thức liên tục về AI
🟠 https://t.co/wOX7GsW3qv
---

Anthropic càn quét ngành dịch vụ tài chính bằng Claude và đây là người họ tuyển 👇
Giám đốc Vận hành (COO) kiêm Trưởng bộ phận Sản phẩm và Kỹ thuật lõi làm gần 19 năm tại một trong những tổ chức tài chính lớn nhất thế giới aka Goldman Sachs để trở thành...
Giám đốc Điều hành phụ trách Dịch vụ Tài chính tại Anthropic!
Thông tin thú vị là 40% trong số 50 khách hàng hàng đầu của Anthropic là các tổ chức tài chính. Sắp tới Mythos ra mắt thì ngành cyber security sẽ tiếp tục bị càn quét.
Mà thời này AI còn chưa kết hợp mạnh với robot...

✅ 21 yếu tố quan trọng nhất ảnh hưởng đến câu trả lời của AI
1/ Temperature
Độ “sáng tạo” của AI. Temperature thấp thì AI trả lời ổn định, an toàn và ít random hơn. Hợp cho coding, phân tích dữ liệu hay workflow cần tính chính xác. Temperature cao thì AI sáng tạo hơn, brainstorm đa dạng hơn nhưng dễ hallucination hơn.
Ví dụ:
Temperature = 0 → hỏi nhiều lần gần như ra cùng đáp án
Temperature = 1.2 → mỗi lần có thể trả lời khác hẳn
2/ Top-p
Giới hạn phạm vi token AI được phép chọn tiếp theo. Hiểu đơn giản là AI chỉ được chọn trong nhóm từ có xác suất cao nhất thay vì toàn bộ từ vựng. Top-p thấp giúp output tập trung hơn, top-p cao giúp output đa dạng hơn.
3/Max Tokens
Giới hạn độ dài output. Nếu để quá ngắn, AI sẽ bị cắt giữa chừng. Nếu để quá dài sẽ tăng chi phí và đôi khi khiến AI lan man hơn.
4/ Context Window
Lượng thông tin AI có thể nhìn cùng lúc. Ví dụ: 8k token, 32k token, 128k token, 1M token.
Context window càng lớn thì AI càng đọc được nhiều file, nhiều đoạn chat và nhiều tài liệu hơn trong một lần xử lý. Nhưng cũng không phải càng nhiều là càng tốt, mà đôi khi càng cô đọng thì sẽ ra được kết quả chính xác hơn.
5/ System Prompt
“Luật nền” điều khiển hành vi AI. Đây là thứ quyết định AI đóng vai trò gì, giọng văn ra sao, được phép hay không được phép làm gì. System prompt thường ảnh hưởng cực mạnh tới output.
Ví dụ: “Bạn là chuyên gia tài chính", “Trả lời ngắn gọn”, “Luôn viết bằng tiếng Việt”...
6/ Conversation History
Toàn bộ lịch sử chat trước đó. AI dùng phần này để giữ mạch hội thoại và hiểu ngữ cảnh hiện tại. Đó là lý do chat càng dài thì AI càng “hiểu mình hơn”.
7/ Memory
Bộ nhớ dài hạn lưu sở thích, thói quen hoặc thông tin người dùng. Memory giúp AI cá nhân hóa câu trả lời giữa nhiều cuộc trò chuyện khác nhau.
8/ RAG (Retrieval-Augmented Generation)
Cơ chế nhét thêm tài liệu ngoài vào context trước khi AI trả lời. RAG giúp AI trả lời dựa trên dữ liệu riêng thay vì chỉ dùng kiến thức pretrain.
Ví dụ: PDF nội bộ, Notion, Google Drive, Vector Database
9/ Embedding Quality
Chất lượng embedding quyết định khả năng tìm đúng context trong RAG system. Embedding càng tốt thì AI càng lấy đúng tài liệu liên quan.
10/ Fine-tuning
Huấn luyện thêm model cho domain hoặc phong cách cụ thể. Fine-tune giống như “đào tạo nghề” thêm cho model. Ví dụ: AI chuyên luật, AI chuyên y tế, AI viết theo style riêng
11/ RLHF (Reinforcement Learning from Human Feedback)
Lớp huấn luyện hành vi bằng feedback con người. Đây là thứ giúp AI trả lời tự nhiên, an toàn và “giống trợ lý” hơn.
12/ Sampling Strategy
Cách model chọn token tiếp theo. Temperature và Top-p thực ra nằm trong nhóm sampling này. Sampling khác nhau → output khác nhau dù cùng model.
13/ Seed
Con số cố định randomness. Dùng để tái tạo kết quả giống nhau giữa nhiều lần chạy. Rất quan trọng khi testing hoặc benchmark model.
14/ Quantization
Nén model để chạy nhẹ hơn trên GPU yếu hoặc máy local. Quantization giúp tiết kiệm VRAM nhưng đôi khi làm giảm chất lượng output.
15/ Inference Engine
Hệ thống dùng để serve model. Cùng một model nhưng inference stack khác nhau vẫn có thể cho tốc độ và chất lượng khác nhau. Ví dụ: vLLM, Ollama, TensorRT-LLM, Groq stack,...
16/ GPU / Hardware
Phần cứng ảnh hưởng trực tiếp tới: tốc độ, context length, batch size, khả năng chạy model lớn. Đó là lý do NVIDIA gần như trở thành “xương sống” của ngành AI hiện tại vì GPU hoạt động hiệu quả.
17/ Agent Loop
Cách AI tự suy nghĩ nhiều bước và gọi tool liên tục. Agent loop càng tốt thì AI càng “giống nhân viên” thay vì chatbot.
Ví dụ: AI tự search web, tự đọc file, tự sửa code, tự kiểm tra output
18/ Tool Calling
Khả năng dùng công cụ ngoài như browser, Python, database, email, calendar, API. Tool giúp AI vượt khỏi giới hạn “chỉ chat text”.
19/ Context Engineering
Cách sắp xếp, nén và quản lý context trước khi đưa vào model. Đây đang là một trong những lợi thế cạnh tranh lớn nhất của các AI product hiện nay.
20/ Training Data
Dữ liệu dùng để train model. Dữ liệu càng lớn và chất lượng càng cao thì model càng thông minh. Đây là “nguồn thức ăn” của AI.
21/ Model Architecture
Kiến trúc nền phía dưới model. Hiện tại phần lớn AI text hiện đại đều dùng Transformer hoặc biến thể từ Transformer.
Đó là lý do cùng một nền móng nhưng mỗi công ty vẫn tạo ra chất lượng rất khác nhau bằng cách tối ưu toàn bộ stack phía trên.
AI hiện đại thực ra không còn là “một model”. Nó là cả một hệ thống gồm model + dữ liệu + context + memory + sampling + tools + agent + inference stack + orchestration.
🟠 Follow @nghienaivn để cập nhật kiến thức hữu ích về AI
https://t.co/wOX7GsW3qv
-----

🧠 [Mỗi ngày 1 từ khoá] Kiến trúc Transformer của Google là gì mà gần như toàn bộ AI hiện nay đều chạy trên nó?
Thứ Google tạo ra năm 2017 không chỉ là một AI model mới, mà là một cách hoàn toàn mới để máy hiểu ngôn ngữ.
Trước Transformer, AI đọc văn bản theo kiểu tuần tự từng token một nên rất khó nhớ context dài. Đọc càng xa thì càng mất liên kết với phần đầu câu.
Transformer giải quyết chuyện đó bằng cơ chế “Attention”. Thay vì chỉ nhìn vài chữ gần nhất, model có thể nhìn toàn bộ câu cùng lúc để hiểu ngữ cảnh.
Ví dụ câu:
- “Tôi đi ngân hàng để rút tiền” → hiểu “ngân hàng” là bank tài chính.
- “Tôi ngồi bên bờ ngân hàng” → hiểu theo nghĩa địa lý.
Đây là bước nhảy cực lớn vì AI bắt đầu hiểu context thay vì chỉ đoán token tiếp theo. Transformer cũng cực kỳ hợp với GPU vì có thể xử lý song song cả đoạn văn cùng lúc. Trong khi các kiến trúc cũ như RNN hay LSTM phải đọc từng token tuần tự nên train rất chậm.
Đó là lý do sau 2017, toàn ngành AI tăng tốc khủng khiếp:
- Model scale lớn hơn
- Dataset scale lớn hơn
- GPU cluster scale lớn hơn
- Khả năng AI tăng theo cấp số nhân.
Ngay trong tên ChatGPT cũng đã có chữ Transformer: Generative Pretrained Transformer.
Hiện tại gần như mọi công ty AI lớn như OpenAI, Anthropic, Meta hay DeepSeek đều xây trên nền móng này. Họ cạnh tranh ở dữ liệu, cách train, inference hay agent system, nhưng phần lõi xử lý ngôn ngữ vẫn là Transformer.
Đây cũng là lý do các công ty AI Trung Quốc chưng cất model rất nhanh. Vì phần lớn AI text hiện đại đều dùng cùng kiểu kiến trúc, nên việc transfer knowledge giữa các model dễ hơn rất nhiều. Giống như cả ngành đang dùng chung một loại động cơ, còn mỗi công ty tối ưu chiếc xe riêng của mình.
Follow @nghienaivn để bắt kịp AI trong 2 tháng!
https://t.co/wOX7GsW3qv
----

⚠️ CEO Coinbase thông báo giảm 14% nhân sự vì AI & Cách cấu trúc lại công ty khi có AI
Brian Armstrong vừa gửi internal memo cho toàn bộ nhân viên Coinbase để giải thích vì sao công ty cắt giảm khoảng 14% nhân sự. Nhưng thứ đáng chú ý nhất trong email này nằm ở phần ông mô tả cách Coinbase đang thiết kế lại cả hệ thống vận hành xoay quanh AI.
Theo Brian, năng suất làm việc trong nội bộ đã thay đổi cực mạnh chỉ trong 1 năm. Các engineer dùng AI để ship sản phẩm trong vài ngày thay vì vài tuần. Team non-tech giờ cũng có thể tạo production code và tự động hóa workflow của riêng mình.
Điều này khiến Coinbase bắt đầu chuyển sang một mô hình tổ chức hoàn toàn khác.
Công ty sẽ làm phẳng cấu trúc quản lý, giới hạn tối đa 5 tầng dưới CEO/COO để tăng tốc độ ra quyết định. Các leader sẽ quản lý nhiều người hơn và đồng thời trực tiếp tham gia execution giống một “player-coach”.
Coinbase cũng bắt đầu xây các “AI-native pod” - những team cực nhỏ nhưng leverage rất mạnh nhờ AI agents. Một người có thể quản lý nhiều agent cùng lúc để xử lý coding, research, support, operation hay product workflow.
Thậm chí Coinbase còn thử nghiệm mô hình “one person team”, nơi một cá nhân kiêm luôn vai trò PM, design và engineering với AI là lớp hạ tầng hỗ trợ phía dưới.
Câu thú vị nhất trong memo là: “Rebuilding Coinbase as an intelligence, with humans around the edge aligning it.”
Hiểu đơn giản là Coinbase đang muốn biến công ty thành một hệ thống trí tuệ vận hành bằng AI, còn con người tập trung vào định hướng, kiểm soát context và ra quyết định cuối cùng.
Đây cũng là thứ đang bắt đầu xuất hiện ở rất nhiều công ty AI-native hiện nay: team nhỏ hơn, tốc độ execution nhanh hơn, ít layer hơn và output trên mỗi nhân sự tăng mạnh nhờ agent.
Trước đây muốn scale công ty thì phải tuyển thêm người. Bây giờ muốn scale công ty thì phải tăng leverage bằng AI.
#nghienAI

Doanh nghiệp một người (OPC) - Điều không thể nào làm được nếu như không giỏi AI 💯
Vừa đây, trang Thông tin Chính phủ đã đăng bài về việc ban hành Chiến lược quốc gia về khởi nghiệp sáng tạo đã lần đầu tiên đặt vấn đề thí điểm mô hình "doanh nghiệp một người" (One-Person Company – OPC), nhằm đưa khởi nghiệp trở thành cơ hội thực tế với mọi người dân, thay vì chỉ dành cho một nhóm nhỏ doanh nghiệp có điều kiện.
Từ góc độ cá nhân, mình cũng đang học để xây dựng được OPC nhưng phải nói là khó cực kỳ. Chưa cần đạt đến trình độ One Company, chỉ cần build được AI Agent để đảm nhận công việc của một người, một team đã không dễ.
Nhưng đây sẽ là xu hướng chung của toàn thế giới mà không ai có thể ngăn cản. Một là phải all-in học, còn không thì sẽ bị bỏ lại.
Join cộng đồng @nghienaivn tại đây 👇
https://t.co/wOX7GsW3qv
-----

[Tới giờ học] Mấy anh Trung Quốc đã clone AI model đạt 80% bản gốc rồi bán giá 1/10 như thế nào? 😁
Điểm mấu chốt nằm ở chưng cất: lấy cách trả lời của model lớn làm dữ liệu, rồi dạy lại cho model nhỏ. LLM vốn chỉ là hệ dự đoán token tiếp theo, nên nếu có đủ nhiều cặp hỏi – đáp chất lượng cao, model nhỏ sẽ học được pattern đó.
Trong lúc huấn luyện, họ tối ưu hai thứ cùng lúc:
- Học đúng câu trả lời (cross-entropy)
- Học “độ tự tin” của từng từ mà model lớn đã chọn (KL-divergence trên logits).
Nhờ vậy, model nhỏ không chỉ trả lời đúng ý mà còn giữ được độ mượt và ổn định.
Phần quyết định chất lượng nằm ở pipeline dữ liệu. Các team như Moonshot, https://t.co/uBFZm5Tpwu, DeepSeek không bắn prompt ngẫu nhiên mà thiết kế bộ câu hỏi phủ đúng các tình huống dùng thật: chăm sóc khách hàng, viết nội dung, code, phân tích.
Mỗi câu hỏi được hỏi nhiều lần ở các mức “sáng tạo” khác nhau để lấy nhiều phương án trả lời, sau đó dùng một hệ chấm điểm để chọn câu tốt nhất theo tiêu chí rõ ràng: đủ ý, đúng tone, đúng format.
Ví dụ một câu “Khách yêu cầu hoàn tiền vì sản phẩm lỗi”, họ sẽ giữ câu trả lời có cấu trúc chuẩn: xin lỗi → hướng dẫn xử lý → kết thúc bằng hành động cụ thể.
Khi bước vào huấn luyện, model nhỏ chỉ cần học lại mapping đã được “tinh chế” này. Với các bài toán nhiều bước, họ cho model lớn giải theo nhiều cách, chọn lời giải cho kết quả ổn định nhất rồi đưa vào dữ liệu. Model nhỏ học lại pattern đó nên vẫn giữ được logic cơ bản.
Ví dụ bài toán tính chi phí đơn hàng sau giảm giá và phí ship, model nhỏ sẽ tái tạo đúng thứ tự tính toán đã được chọn từ model lớn.
Đánh giá chất lượng được gắn trực tiếp với bài toán thực tế. Với code thì đo pass@k, tức là chạy có đúng không; với hỏi đáp thì đo exact match hoặc F1; với nội dung thì so trực tiếp câu trả lời giữa model nhỏ và model lớn để tính win-rate.
Ví dụ đưa 100 câu hỏi support, nếu model nhỏ được chọn tốt hơn 60 lần thì win-rate là 60%. Song song đó, họ đo độ ổn định: cùng một câu hỏi, model có trả lời nhất quán hay không, và đo calibration để xem mức độ tự tin có khớp với độ chính xác.
Khi đưa vào sản phẩm, họ không dùng một model duy nhất mà chia việc theo chi phí. Model nhỏ xử lý phần lớn câu hỏi phổ biến vì rẻ và nhanh, còn những câu phức tạp sẽ được chuyển sang model lớn.
Ví dụ một hệ thống chăm sóc khách hàng có thể để 80% câu hỏi như “Đơn hàng ở đâu?”, “Đổi trả thế nào?” cho model nhỏ xử lý, và chỉ đẩy các trường hợp tranh chấp thanh toán lên model lớn. Với cấu trúc này, chi phí trung bình giảm mạnh trong khi trải nghiệm vẫn ổn định.
Một bước tối ưu sâu hơn là nén cả workflow. Một agent nhiều bước trước đây phải đọc dữ liệu, phân tích, viết, kiểm tra rồi chỉnh sửa. Họ log toàn bộ input và output cuối, sau đó train model nhỏ học trực tiếp kết quả.
Ví dụ từ yêu cầu “Viết báo cáo tuần từ dữ liệu này”, model nhỏ trả luôn báo cáo hoàn chỉnh trong một bước, không cần chạy qua nhiều vòng suy luận. Độ trễ giảm và chi phí cũng giảm theo.
Về kinh tế, cách này tạo ra chênh lệch rất lớn. Model lớn đạt chất lượng cao nhưng chi phí cao, còn model chưng cất đạt khoảng 70–90% hiệu năng trong các tình huống lặp lại với chi phí chỉ bằng một phần nhỏ. Đây là lý do vì sao các model Trung Quốc có thể rẻ hơn nhiều nhưng vẫn dùng tốt trong phần lớn use case.
Toàn bộ hệ thống vận hành xoay quanh bốn điểm: dữ liệu được thiết kế đúng phân phối sử dụng, loss tối ưu để giữ hành vi của model lớn, đánh giá sát với bài toán thật, và routing để cân bằng chi phí – chất lượng.
Vừa có kinh nghiệm & vừa có kiến thức. Follow @nghienaivn ở đây nè 👇
https://t.co/wOX7GsW3qv
---

Giải quyết vấn đề bí ý tưởng cho design system (design.md) với app này 👇
Có hơn 2.000 file DESIGN.md được trích ra từ các sản phẩm top.
Trong đó đã có sẵn:
- Màu sắc (colors)
- Kiểu chữ (typography)
- Khoảng cách (spacing)
- Quy tắc component
Tất cả được đóng gói trong một file Markdown .md duy nhất để AI đọc trước khi nó generate bất kỳ thứ gì.
Dùng được với Claude Code, Cursor, Lovable, Bolt. Miễn phí 100%.
À nhưng mình thấy mấy cái liên quan tới design thì gửi Codex hoặc Claude là ổn nhất, gửi cho mất model Trung Quốc nó design không đẹp, bị nhiều lỗi 😁
Toàn bộ các app mình dùng cho design.md
1/ https://t.co/3UdVSi5iuy
2/ https://t.co/2d4aecS601
3/ https://t.co/SU0eINX5JU
4/ https://t.co/cL1awScEqo
5/ https://t.co/bhFLgYewl9
6/ https://t.co/sNV6EcI7VA
Chúng anh em thiết kế đẹp 😁
Follow @nghienaivn để thay đổi hoàn toàn workflow với AI: https://t.co/wOX7GsW3qv
Nguồn: dr_cintas
✅ Làm slide với tool này tiện ghê
Nếu như cần tạo slide nhanh để present, các bạn có thể dùng Claude/Codex luôn nhưng nhược điểm là nó không thể edit các element như edit chữ, edit màu, căn chỉnh tỷ lệ trực tiếp trên HTML slide sau khi đã tạo ra rồi.
Mỗi lần prompt chỉnh lại cũng kha khá thời gian.
Nhưng project dưới đây fix vấn đề đó. Ví dụ như mình đã có 1 bài viết về "AI Engineering Framework" và cần nó tạo slide để thuyết trình. Nó tạo luôn cho mình 8 slide (chỗ này mình chưa prompt kỹ nên nội dung còn sơ xài lắm).
Sau đó muốn edit màu, nội dung (như dưới video) thì nó mở luôn cái app localhost để edit khá tiện.
Link Github Repo & hướng dẫn 👇
Bắt đầu từ link GitHub, bạn chỉ cần đưa thẳng cho Claude hoặc Codex kèm một yêu cầu rõ ràng: “clone repo này, cài dependency, chạy dev server và báo lại khi mở được trên localhost”. Agent sẽ tự đọc README, tự chạy init, cài gói và mở project.
https://t.co/9G0nYH7tEW
Khi nó báo đã chạy xong, bước tiếp theo là đưa nội dung để nó làm slide. Cách hiệu quả nhất là gửi trực tiếp một bài viết hoặc nội dung thô kèm yêu cầu cụ thể, ví dụ: “chuyển nội dung này thành 10 slide, mỗi slide một ý chính, tiêu đề ngắn, ít chữ, ưu tiên trình bày trực quan”.
Nếu bạn có sẵn cấu trúc thì đưa luôn, ví dụ chia rõ phần mở đầu, vấn đề, insight, giải pháp, vì agent sẽ bám vào đó để dựng deck chính xác hơn thay vì tự đoán.
Ví dụ:
Slide 1: Hook
Slide 2–4: Problem
Slide 5–8: Insight
Slide 9–12: Solution
Sau khi nó tạo xong, bạn mở giao diện slide trên trình duyệt, click vào từng phần và ghi comment kiểu “đổi màu đoạn này”, “rút ngắn câu này”, “headline mạnh hơn”.
Quay lại agent và yêu cầu nó áp dụng toàn bộ comment, nó sẽ sửa trực tiếp trong code và cập nhật lại slide. Bạn lặp lại vòng này vài lần là ra bản hoàn chỉnh.
---
Follow @nghienaivn để học nhiều tip hay về AI
💯 https://t.co/wOX7GsW3qv
----
🖼️ Vừa nhờ AI làm poster cho brand Nghiên AI @nghienaivn nhưng phá cách hơn và đây là kết quả
Công nhận trí tưởng tượng của ChatGPT Image 2.0 bay xa thật 😁
PROMPT 👇
"https://t.co/Pq4D7TiCWt
Based on the skill above, generate images for a website for an AI agency. The design should include eight sections, with one image per section, for a total of eight distinct images.
The website is for a creative AI company focused on research in creativity and design. Because of that, I want the visuals to feel highly original, playful, and art-directed, with text integrated thoughtfully into the design. Make it feel ultra-creative and intentional, like an Awwwards SOTD-level website in both concept and execution.
Please go beyond standard layouts. Do not rely only on simple text-left, image-right compositions. Explore more experimental and varied layouts. Feel free to go completely wild, but keep it purposeful, not random. I want different section structures, including horizontal images, fullscreen sections, full background imagery, and more minimal sections with beautiful colors and a strong sense of motion or animation.
Please use full background images or strong full-background color compositions, not just plain white sections. Keep it in light mode.
Overall, try to stay somewhat consistent across the site while still making each section feel distinct. I want it to look crazy creative, thoughtful, and visually impressive, with strong UX and a clear sense of purpose.
Generate 8 different images total.
Do not combine them into one image.
Each image should represent one section of the website."
----
Nhưng trước khi dán prompt dưới đây, bạn cần có mô tả sơ bộ thương hiệu của bạn là gì? Tông màu chủ đạo là gì? Thương hiệu làm ngành gì? để nó có hình dung trước rồi mới làm được nha 😁
Follow @nghienaivn để bắt kịp AI trong 2 tháng
🟠 https://t.co/wOX7GsW3qv
----




Làm thế nào để AI làm việc xuyên đêm trong lúc mình đi ngủ? 🛌💤
Hôm bữa mình có chia sẻ mình cắm máy cho AI cày cả đêm với combo Opencode + Ollama Cloud AI API thì nhiều anh em có hỏi cách setup nên mình viết bài này share mọi người tham khảo 😁
Để AI làm được điều này bạn cần vài thứ sau
1. Máy không tắt (Phải chỉnh chế độ ngăn nó đi ngủ nếu bạn dùng Laptop)
2. AI Model support phục vụ làm task dài (Cái này mình dùng model GLM 5.1 của Trung Quốc, chuyên build cho task dài luôn. Chứ dùng model khác cắm vào thì nó cứ 15 phút là dừng lại hỏi ngu 🥹)
3. Bạn phải cung cấp cho nó đủ công cụ, context, workflow.
- Cái số 3 là cái khó nhất. Bữa trước mình có viết bài về cách yêu cầu AI hỏi mình 100-200 câu hỏi trước khi build 1 app, 1 tính năng nào đó.
- Yêu cầu nó pop-up interaction box thể mình chọn các option, cái nào không biết thì mình gõ "cần tư vấn theo nhu cầu... abc xyz của tôi".
- Hãy yêu cầu nó đặt câu hỏi về tech stack, UI UX, userflow,... tất cả mọi thứ. Tip để biết bạn hỏi đủ số lượng chưa là lúc nó hỏi 10 câu thì hết 8 câu bạn không biết phải trả lời và cần tư vấn.
- Khi nó tư vấn xong => bạn chọn xong option thì đó là lúc nó đã làm rõ được plan trước khi build.
4/ Sau khi đã hoàn thành plan thực thi dạng file .md. Bạn hãy yêu cần nó viết plan đánh giá & test sau khi thực thi luôn rồi chuyển từ chế độ Plan Mode sang Build Mode rồi cho nó chạy thôi.
À quên, cái quan trọng nhất là tài khoản phải có đủ token cho nó đốt 😁
Anh em còn cách nào hay hơn không ạ? Ví dụ như nhiều Agent làm việc và feedback cho nhau chẳng hạn, cái này nghe lý thuyết nhiều nhưng chưa áp dụng thử. Xin được chỉ giáo ạ 🙌
Follow @nghienaivn để xoá mù AI trong 2 tháng
🫶 https://t.co/wOX7GsW3qv
-----

✅ [Hữu ích] Đừng để AI tự bịa userflow! App này sẽ giải quyết vấn đề đó!
Cái này đáng dùng vì nó giải quyết đúng vấn đề lớn nhất khi làm design với AI: thiếu dữ liệu thực tế.
Thay vì để AI tự “nghĩ” ra UI theo kiểu chung chung, bạn có thể cho nó xem hàng trăm nghìn màn hình app thật, phân tích cách các công ty đang làm, gom lại thành pattern, chỉ ra cái nào hiệu quả, cái nào nên tránh rồi đưa ra gợi ý rất cụ thể kèm ví dụ.
Bạn còn có thể kéo nhanh reference, so trực tiếp design của mình với các sản phẩm top hoặc lấy ý tưởng từ những ngành hoàn toàn khác để tránh bị lặp lại.
Điểm hay nữa là nó có sẵn thư viện user flow rất lớn từ onboarding, đăng ký, đăng nhập, permission, settings, profile cho đến các flow quan trọng như search, paywall, checkout, dashboard, chat, review… và có MCP luôn nên AI agent và người xem có thể hiểu luôn cả hành trình người dùng chứ không chỉ từng màn hình riêng lẻ.
🟠 Web đây nè https://t.co/tQ06H8vVSr
Còn muốn cho AI Agent research để sử dụng thì copy prompt ở đây: https://t.co/5uwsr8SneZ
Follow @nghienaivn để biết thêm nhiều tips hữu ích để vibecode đúng hướng với AI 👇
https://t.co/wOX7GsW3qv
----

[Prompt bóc tách một thiết kế brand] Từ “wow đẹp” → “à hiểu rồi”
Đây là cách mình hay làm khi thấy một brand quá đẹp: không chỉ nhìn cho “đã mắt” mà sẽ cố dịch nó về dạng system (kiểu design.md) để hiểu nó đang vận hành như thế nào, màu dùng để làm gì, font dùng ở đâu, spacing ra sao, layout lặp lại theo pattern gì. Kiểu như thay vì học cảm tính, mình biến nó thành thứ có thể reuse được.
Cái hay là nó giúp mình rút ngắn rất nhiều thời gian “mò mẫm”, đặc biệt nếu bạn đang build nhanh sản phẩm kiểu vibecode - cần một thứ đủ tốt, đủ sạch, deploy được luôn.
Nhưng nếu nghĩ nó là cách để “tái tạo brand” thì hơi ảo 😄 Vì một brand mạnh không nằm ở UI, mà nằm ở những quyết định phía sau UI: họ chọn nói chuyện với ai (ICP), nói bằng giọng gì (tone), muốn người ta nhớ mình như thế nào (positioning), và họ kiên định với điều đó bao lâu. Mấy thứ này không thể nhìn screenshot mà hiểu hết.
Nên cách dùng hợp lý hơn là coi nó như một lớp hỗ trợ ban đầu:
- Tìm pattern lặp lại (spacing, hierarchy, component logic)
- Hiểu màu đó đang đóng vai trò gì trong hệ thống
- Hiểu flow người dùng mà layout đó phục vụ
Sau đó, layer thêm context của bạn vào:
- Sản phẩm của mình phục vụ ai?
- Hành vi chính là gì?
- Cần cảm giác “tin tưởng”, “nhanh”, hay “premium”?
Rồi từ đó biến cái học được thành system của riêng mình. Nếu làm tới nơi tới chốn hơn một chút, bạn có thể:
gom lại thành 1 “Company design.md” (color, type, spacing, components, tone)
- thêm ví dụ good/bad để system tự học
- test trực tiếp trên landing / UI thật
- cải tiến liên tục (vì design system không phải thứ build 1 lần là xong)
Lúc đó, bạn có bộ khung đủ tốt để build sản phẩm nhanh mà vẫn có gu.
PROMPT phía dưới 👇


💯 Đây là cách công ty AI native vận hành - Chia sẻ bởi CEO của https://t.co/vzjJqiMtcs
Ông CEO của https://t.co/vzjJqiMtcs chia sẻ về cách họ vận hành một công ty AI-native, anh em đọc thử xem có áp dụng được gì không 😁
Điểm khác biệt lớn nhất là họ không dùng AI như một tool phụ trợ, mà thiết kế lại toàn bộ cách làm việc xoay quanh AI ngay từ đầu. Kiểu không phải “dùng thêm AI cho nhanh”, mà là build cả hệ thống để AI có thể làm việc cùng team.
Toàn bộ dữ liệu công ty được gom vào một repo GitHub gọi là “Company OS”. Trong đó có đủ thứ: tài liệu nội bộ, SOP, playbook, dữ liệu thị trường… Mỗi client cũng có một repo riêng, chứa toàn bộ context như brand, campaign, lịch sử làm việc. Nhờ vậy, mỗi lần làm việc với Claude là đã có sẵn context, không cần ngồi giải thích lại từ đầu.
Thay vì làm việc qua mấy cái UI SaaS như bình thường, họ chuyển dần sang dùng Claude Code + CLI + MCP. Nghe hơi technical nhưng hiểu đơn giản là AI không chỉ “gợi ý” nữa, mà có thể trực tiếp làm việc: đọc file, sửa dữ liệu, chạy workflow, kết nối với Slack, Google Docs, Airtable… Lúc này AI không còn đứng ngoài nữa, mà tham gia luôn vào hệ thống vận hành.
Các việc lặp lại như onboarding khách hàng, research nội dung, xử lý phản hồi hay kiểm tra campaign trước khi chạy thì gần như để AI làm hết. Con người tập trung vào mấy phần quan trọng hơn như strategy với creative. Nhờ vậy team không cần tăng người quá nhiều mà vẫn scale được.
Một điểm mình thấy khá hay là hệ thống này tự cải thiện theo thời gian. Team có thể thêm agent, skill, chỉnh workflow thông qua pull request như code bình thường. Đồng thời dữ liệu từ quá trình làm việc cũng được đẩy ngược lại để AI học tiếp. Càng dùng lâu thì hệ thống càng “khôn” hơn.
Mời các bạn join @nghienaivn tại đây, có nhiều bài viết xịn, anh em cộng đồng support xịn 😁
https://t.co/wOX7GsW3qv




































