DEV Community
•
2026-04-23 04:13
Gemma 4 VLA chạy cục bộ trên Jetson Orin Nano 8GB
Tổng quan hệ thống, tối ưu và cách triển khai
Chạy một mô hình Vision-Language-Action (VLA) hoàn toàn cục bộ trên thiết bị edge 8GB nghe có vẻ hơi quá sức, nhưng demo này cho thấy điều đó đã bắt đầu khả thi nếu tối ưu đúng chỗ. Trọng tâm ở đây không phải là một chatbot gắn thêm webcam cho có, mà là một hệ thống có thể:
nghe người dùng qua micro,
hiểu yêu cầu bằng mô hình ngôn ngữ,
...