Giới thiệu
6 phút đọc1 tháng 6, 2026

Bumblebee: Perplexity AI tung tool scan supply-chain cho developer endpoint

Perplexity AI vừa open-source Bumblebee một static binary quét metadata package, extension, và dev tools trên máy developer để phát hiện supply-chain compromise.

N

Nguyễn Nhật Long

@nguyennhatlong1303

Bumblebee: Perplexity AI tung tool scan supply-chain cho developer endpoint

Bumblebee: Perplexity AI tung tool scan supply-chain cho developer endpoint

Máy của bạn đang cài bao nhiêu npm package, VS Code extension, MCP config? Bạn có chắc không có cái nào nằm trong danh sách bị compromise? Nếu ngày mai có một advisory nói "package X version Y đã bị inject malware", bạn mất bao lâu để biết máy nào trong team đang dính?

Perplexity AI vừa open-source một tool giải quyết đúng bài toán này: Bumblebee.

Chuyện gì đang xảy ra?

Perplexity AI đúng, cái công ty AI search engine đó vừa public repository perplexityai/bumblebee trên GitHub. Tính đến thời điểm hiện tại, repo đã có hơn 4.1k stars358 forks, con số khá ấn tượng cho một project mới.

Bumblebee là một read-only inventory collector nó quét metadata của package, extension, và developer tool trên máy macOS/Linux. Mục tiêu duy nhất: khi có advisory về supply-chain compromise, bạn chạy một lệnh và biết ngay máy nào đang dính.

Điều mình thấy hay là project này không cố làm quá nhiều thứ. Nó không phải SBOM generator, không phải EDR, không phải vulnerability scanner tổng quát. Nó giải quyết một bài toán cụ thể và làm tốt bài toán đó.

Tại sao supply-chain response lại cần tool riêng?

Bạn có thể thắc mắc: "SBOM và EDR không đủ sao?"

Thực tế là mỗi tool trả lời một câu hỏi khác nhau:

Theo kinh nghiệm của mình, khi xảy ra sự cố supply-chain (nhớ vụ event-stream, ua-parser-js, hay gần đây hơn là xz-utils?), điều responder cần nhất là tốc độ: biết ngay ai đang bị ảnh hưởng. SBOM cho bạn biết production có dính không, nhưng máy dev thì sao? Cái lockfile trên máy anh backend có version bị compromise không? Extension trên VS Code của chị frontend có trong danh sách đen không?

ToolCâu hỏi nó trả lờiHạn chế với supply-chain response
**SBOM**Cái gì đã được ship trong artifact?Không cover local dev dependencies, extensions, tools
**EDR**Cái gì đã chạy hoặc kết nối network?Không biết package nào đang nằm trên disk mà chưa execute
**Bumblebee**Máy developer nào đang có package/extension/version này trên disk?Chỉ read-only, không execute package manager

Đó chính xác là khoảng trống Bumblebee lấp vào.

Bumblebee hoạt động thế nào?

Một vài điểm kiến trúc đáng chú ý:

Single binary, zero dependencies

Bumblebee được viết bằng Go 1.25+, build ra một static binary duy nhất, không có non-stdlib dependency nào. Điều này cực kỳ quan trọng cho một security tool bạn không muốn tool scan supply-chain của mình lại bị... supply-chain attack.

Mình đánh giá cao quyết định thiết kế này. Nhiều security tool ngoài kia pull cả đống dependency, tạo ra một irony khá buồn cười.

Ba scan profile cho các use case khác nhau

Cách chia này hợp lý. Bạn không muốn chạy deep scan hàng ngày trên 200 máy dev, nhưng khi có advisory thì cần scan sâu ngay lập tức.

ProfileUse caseMô tả
`baseline`Chạy thường xuyên, toàn bộ fleetScan nhẹ, focus vào các metadata cơ bản
`project`Scan theo project cụ thểĐi sâu hơn vào lockfile và project dependencies
`deep`Incident response, chạy khi cầnQuét toàn bộ, bao gồm extension manifests và MCP configs

Read-only thuần túy

Đây là điểm mình muốn nhấn mạnh: Bumblebee không bao giờ execute package manager. Không npm ls, không pip show, không go list. Nó chỉ đọc file trên disk lockfile, metadata, manifest.

Tại sao điều này quan trọng? Vì khi bạn chạy npm ls, npm có thể execute lifecycle scripts. Trong bối cảnh supply-chain compromise, execute bất cứ thứ gì liên quan đến package bị compromise là điều cuối cùng bạn muốn làm.

Coverage nó quét được những gì?

Phạm vi coverage khá rộng và cover đúng những ecosystem mà developer Việt Nam hay dùng:

Điều đáng chú ý là phần MCP config scanning. Với sự bùng nổ của AI coding tools gần đây (Claude Code, Cursor, Windsurf...), MCP server configs trở thành một attack surface mới. Bumblebee đã cover sẵn và nó đủ thông minh để không emit các giá trị environment và credentials trong env blocks của MCP config, dù vẫn parse được inventory.

EcosystemNguồn dữ liệu
**npm** (npm, pnpm, Yarn, Bun)`package-lock.json`, `pnpm-lock.yaml`, `yarn.lock`, `bun.lock`, `node_modules/*/package.json`
**PyPI**`*.dist-info/METADATA`, `*.egg-info/PKG-INFO`
**Go modules**`go.sum`, `go.mod`
**RubyGems**`Gemfile.lock`, `*.gemspec`
**Composer**`composer.lock`, `vendor/composer/installed.json`
**MCP configs**`mcp.json`, `claude_desktop_config.json`, `~/.claude.json`, và nhiều format khác
**Editor extensions**VS Code, Cursor, Windsurf, VSCodium manifests
**Browser extensions**Chromium (`manifest.json`), Firefox

Ai nên quan tâm?

Nếu bạn thuộc một trong các nhóm sau, Bumblebee đáng để thử:

  • Security team / DevSecOps: Cần khả năng respond nhanh khi có supply-chain advisory. Chạy Bumblebee với exposure catalog, có kết quả NDJSON ngay.
  • Engineering manager: Muốn biết fleet developer machine đang dùng những gì, đặc biệt khi onboard tool mới hoặc audit extension policy.
  • Solo developer / freelancer: Đơn giản là muốn biết máy mình có đang cài cái gì đáng ngờ không.

Output ở dạng NDJSON (Newline-Delimited JSON) nên rất dễ pipe vào các tool khác jq, Elasticsearch, hay bất kỳ SIEM nào bạn đang dùng.

Một vài suy nghĩ cá nhân

Theo kinh nghiệm của mình làm việc với các team ở Việt Nam, supply-chain security thường bị xếp vào dạng "biết là quan trọng nhưng chưa có thời gian làm". Phần lớn team chỉ react khi có sự cố, và lúc đó thì cuống.

Bumblebee giảm friction đáng kể. Một static binary, không cần cài đặt phức tạp, không cần agent chạy daemon, không modify gì trên máy. Chạy xong, lấy kết quả, xong.

Điều mình hơi tiếc là hiện tại chưa support Windows (chỉ macOS và Linux). Với nhiều team ở Việt Nam vẫn dev trên Windows, đây là một gap đáng kể. Nhưng với 18 pull requests đang mở, cộng đồng có vẻ đang rất active contribute.

Một điểm nữa: việc Perplexity AI một công ty AI lại open-source một security tool là khá thú vị. Nó cho thấy họ đang nghiêm túc với infrastructure security nội bộ, và sẵn sàng chia sẻ tooling với cộng đồng. Đây là kiểu open-source mình muốn thấy nhiều hơn từ các công ty tech lớn.

Tiếp theo là gì?

Project đang ở v0.1, còn khá sớm. Một vài thứ đáng theo dõi:

  • Non-JSON MCP configs (Codex config.toml, Continue YAML) chưa được parse chắc chắn sẽ có trong các version sau.
  • Windows support chưa có timeline rõ ràng nhưng với lượng interest hiện tại, khả năng cao sẽ được community contribute.
  • Integration với CI/CD output NDJSON rất sẵn sàng cho việc này, chỉ cần ai đó viết wrapper.

Nếu bạn làm security hoặc đơn giản là muốn biết máy dev của mình đang "chứa" những gì, clone repo về chạy thử. Một static binary, vài phút scan, và bạn có một bức tranh rõ ràng hơn nhiều về supply-chain exposure của mình.

Repo: github.com/perplexityai/bumblebee Apache-2.0 license, Go 1.25+, zero dependencies. Không có lý do gì để không thử.

NN

Nguyễn Nhật Long

@nguyennhatlong1303

Nguyễn Nhật Long is a Senior Frontend Engineer and Frontend Team Leader with 7 years of experience building real-time fintech platforms. Specializing in React, Next.js, TypeScript, and React Native, shipping 10+ products across Web, Mobile, Telegram Mini-Apps, and Web3.

Thấy hay? Chia sẻ cho bạn bè!