Back to all posts

Alur kerja dev VM0: Mengelola agent AI seperti sebuah tim

Di tim dev VM0, setiap developer bekerja dengan banyak instance Claude Code sekaligus. Biasanya lebih dari delapan.

Kami memperlakukan Claude Code sama seperti kami memperlakukan developer sungguhan. (Ya, perusahaan kami setengah bercanda disebut AI Colleagues Co!)

Karena itu, filosofi desain di balik alur kerja dev VM0 mencerminkan praktik manajemen tim klasik dalam software engineering.

Kami menggunakan GitHub Issues untuk melacak pekerjaan, Pull Request untuk code review dan merging, serta GitHub Actions untuk menangani otomasi. Selama dua bulan, penyiapan ini membantu kami merilis 404 release dan menulis lebih dari 230.000 baris kode.

Posting ini menjelaskan bagaimana kami membuatnya dapat berjalan, dan mengapa masalah utamanya tidak pernah soal kemampuan AI, melainkan koordinasi manusia.

Alur kerja dev bertenaga AI dalam praktik

Ketika Anda mengoordinasikan banyak agent AI secara paralel, hambatannya bukan apakah model bisa menulis kode. Hambatan sesungguhnya adalah beban kognitif manusia

Alur kerja ini terdiri dari 14 slash command, yang diorganisasi ke dalam tiga lapis: Deep Dive, Issue Management, dan PR Management.

Mari pertama-tama lihat seperti apa alur kerja saya dan bagaimana sebuah fitur biasanya dibangun.

  1. Penyelarasan kebutuhan

    Seorang manusia membuka sesi Claude dan memulai dengan /deep-research. Claude mengumpulkan fakta dari basis kode, dokumentasi, dan konteks yang relevan. Kami mendiskusikan temuannya dan menyelaraskan masalah apa yang sebenarnya sedang kami pecahkan.

  2. Eksplorasi solusi

    Menggunakan /deep-innovate, Claude mengusulkan beberapa kemungkinan arah, beserta trade-off-nya. Kami berdiskusi, mempersempit, dan memilih satu arah.

  3. Pembuatan issue

    Kami membuat GitHub issue menggunakan /issue-create. Manusia meninjau issue tersebut untuk memastikan kebutuhan tertangkap dengan jelas.

  4. Perencanaan dan persetujuan

    Gunakan /issue-plan untuk membiarkan Claude melanjutkan pekerjaan. Claude akan otomatis menjalankan alur kerja deep-dive secara penuh dan memposting hasilnya ke issue, termasuk:

    1. temuan dari /deep-research
    2. perbandingan dari /deep-innovate
    3. rencana implementasi konkret dari /deep-plan
  5. Implementasi

    Setelah disetujui, /issue-action membiarkan Claude mengimplementasikan rencana, menulis test, membuka PR, dan memastikan CI lolos.

  6. Review dan merge

    Kami menggunakan /pr-review untuk review terstruktur, lalu melakukan review manusia final sebelum merge.

    Manusia turun tangan di tiga checkpoint: kebutuhan, arah, dan penerimaan. Selebihnya berjalan secara otonom.

Pergeseran pola pikir: Anda memimpin tim developer AI

Saat saya menyadari bahwa kami membutuhkan alur kerja terstruktur adalah ketika menambah lebih banyak sesi Claude justru memperburuk keadaan. Semakin banyak instance yang saya jalankan secara paralel, semakin sulit melacak apa yang sedang dilakukan masing-masing, dalam keadaan apa pekerjaannya, dan apa yang sudah diputuskan.

Tanpa tool eksternal, saya sama sekali tidak bisa mengelola sebanyak itu instance Claude sekaligus. Saat itulah saya tersadar: ini bukan masalah AI, ini masalah manajemen.

GitHub sudah menjadi tool alami untuk kolaborasi dalam pengembangan perangkat lunak, jadi alih-alih menciptakan sesuatu yang baru, saya mulai memperlakukan Claude sama seperti saya memperlakukan rekan tim manusia. Begitu saya melakukannya, kapasitas manajemen saya tiba-tiba berskala.

Sepuluh tahun pengalaman manajemen proyek dan tim akhirnya masuk akal dalam konteks baru ini. Dengan memperlakukan Claude sebagai anggota tim dan GitHub sebagai ruang komunikasi serta manajemen bersama kami, seluruh sistem kembali dapat dikelola.

Pemimpin tim yang baik tahu kapan harus terlibat dan kapan harus mundur:

CheckpointApa yang saya lakukanApa yang dilakukan AI
KebutuhanMenyelaraskan masalah, memperjelas cakupanMeriset basis kode, mengumpulkan konteks
ArahMeninjau temuan, menyetujui pendekatanMengusulkan 2-3 pendekatan, mengevaluasi trade-off
PenerimaanMeninjau PR, memverifikasi kualitasMengimplementasikan, menguji, memperbaiki CI

Ini mencerminkan cara tim perangkat lunak yang efektif beroperasi. Saya tidak memikromanajemen developer melainkan menetapkan kebutuhan yang jelas, meninjau keputusan kunci, dan memverifikasi keluaran akhir. Prinsip yang sama berlaku saat mengelola agent AI.

Alur deep dive memaksakan pemikiran terstruktur dan lambat

Alur kerja deep dive memaksakan pemikiran yang cermat sebelum implementasi. Terkadang Claude menemui jalan buntu. Ketika itu terjadi, kami memaksa Claude berhenti dan berpikir, lalu membahasnya bersama. Alur ini punya tiga fase:

FaseCommandTujuanKeluaran
Research/deep-researchMengumpulkan fakta, memahami konteksresearch.md
Innovate/deep-innovationMengeksplorasi banyak pendekataninnovate.md
Plan/deep-planMenentukan langkah konkretplan.md

Setiap fase punya batasan ketat.

Batasan-batasan ini memaksa Claude masuk ke penalaran yang lambat dan cermat alih-alih langsung melompat ke kode. Tanpa itu, kasus tepi dan kekhawatiran arsitektural sering terlewat!

Contoh penggunaan

/deep-research investigate the authentication flow, I'm seeing token expiration issues

[Claude researches, analyzes 12 related files, finds 3 similar patterns]

/deep-innovate what are our options for fixing this?

[Claude presents 3 approaches with trade-offs, you pick one]

/issue-create let's track this fix

Untuk tugas sederhana, Anda bisa melewati deep dive dan langsung ke /issue-create.

Untuk tugas kompleks dengan ketidakpastian teknis, fase deep dive membantu memastikan Anda dan Claude selaras sebelum implementasi dimulai.

Gunakan GitHub sebagai memori bersama

Sebagian besar tool AI memperlakukan konteks sebagai sementara. Ketika sesi berakhir, memorinya menghilang.

VM0 menggunakan GitHub sebagai memori persisten:

Fitur GitHubApa yang disimpan
Body issueKebutuhan dan keputusan
Komentar issueRiset, opsi, rencana
Komentar PRReview dan ringkasan
LabelStatus alur kerja

Ini juga memecahkan masalah manusia: pemulihan konteks.

Ketika saya mengelola 8+ instance Claude, saya menerima notifikasi bahwa pekerjaan selesai. Tetapi saya tidak bisa merekonstruksi dari percakapan Claude apa yang sedang dikerjakannya, keputusan apa yang dibuat, atau apa keadaan saat ini.

GitHub issue memecahkan ini. Setiap issue menampilkan:

Format terstruktur ini membuat review jadi efisien. Jadi saya bisa cepat memindai fase-fasenya, memahami pendekatannya, dan menyetujui atau meminta perubahan, semuanya tanpa perlu mengingat percakapan aslinya.

Ketika pekerjaan selesai, saya tak perlu mengingat apa yang terjadi di jendela chat. Saya bisa membuka issue dan melihat keseluruhan ceritanya, terstruktur dan tertulis.

Serah terima antar agent

Karena semua konteks tinggal di GitHub, pekerjaan bisa berpindah antar agent dengan mulus:

Untuk diskusi panjang, /issue-compact mengonsolidasikan semuanya ke dalam body issue yang bersih. Ini membuat serah terima jadi mudah baik untuk manusia maupun AI.

Mari rangkum pola alur kerjanya

Setelah semua itu, izinkan saya merangkum beberapa tips praktis.

Tugas sederhana

/issue-create → /issue-plan → /issue-action → /pr-check-and-merge

Gunakan ini ketika kebutuhan jelas dan pekerjaannya lugas.

Tugas kompleks

/deep-research → discussion → /deep-innovate → discussion →
/issue-create → /issue-plan → /issue-action →
/pr-review → /pr-check

Ini mencegah usaha terbuang pada pendekatan yang salah.

Pekerjaan paralel

Banyak agent bisa bekerja sekaligus selagi manusia meninjau checkpoint yang sudah selesai. Di sinilah alur kerja berskala paling baik.

Agent 1: /issue-plan #123
Agent 2: /issue-plan #124
Agent 3: /pr-review #100
Agent 4: /deep-research new feature requirements

Referensi command

Command deep dive

CommandTujuan
/deep-researchMengumpulkan informasi, memahami basis kode. Tidak boleh ada saran.
/deep-innovateMengeksplorasi 2-3 pendekatan, mengevaluasi trade-off. Tidak boleh ada kode.
/deep-planMembuat langkah implementasi konkret. Tidak boleh ada implementasi.

Command issue

CommandTujuan
/issue-createMembuat issue dari konteks percakapan
/issue-bugMembuat laporan bug dengan langkah reproduksi
/issue-featureMembuat permintaan fitur yang berfokus pada kebutuhan
/issue-planMenjalankan alur kerja deep-dive penuh, memposting hasil ke issue
/issue-actionMelanjutkan implementasi setelah persetujuan manusia
/issue-compactMengonsolidasikan body + komentar issue untuk serah terima

Command PR

CommandTujuan
/pr-checkMemantau pipeline CI, perbaikan otomatis, coba ulang hingga 3x
/pr-reviewMeninjau PR commit-per-commit terhadap standar proyek
/pr-commentMeringkas diskusi percakapan menjadi komentar PR

Memulai

  1. Mulai sederhana: Gunakan /issue-create/issue-plan/issue-action untuk tugas pertama Anda
  2. Tambahkan deep dive untuk tugas kompleks: Ketika kebutuhan tidak jelas atau secara teknis kompleks, mulailah dengan /deep-research
  3. Berskala secara bertahap: Tambahkan lebih banyak instance Claude seiring Anda terbiasa dengan ritme review
  4. Percayai prosesnya: Biarkan Claude bekerja secara otonom di antara checkpoint

Alur kerja ini dirancang untuk diadopsi secara bertahap. Anda tidak perlu menggunakan semua 14 command sejak hari pertama. Mulailah dengan alur issue dasar, lalu tambahkan fase deep dive dan pekerjaan paralel seiring tumbuhnya kepercayaan diri Anda.

Pertimbangan penskalaan: Apa yang harus dilakukan saat Anda punya lebih banyak agent

Alur kerja ini telah diuji dengan 10+ instance Claude bersamaan. Rekomendasi kami:

Faktor pembatasnya bukan alur kerja, melainkan perhatian manusia dan kualitas keputusan. Ketika mengelola lebih dari 10 agent, Anda berisiko menjadi hambatan di checkpoint review, dan kualitas keputusan mulai menurun.

Prinsip klasik "two pizza team" berlaku di sini. Batasan yang sama yang membatasi ukuran tim manusia juga membatasi berapa banyak agent AI yang bisa dikelola satu orang secara efektif.

Saya saat ini sedang mengeksplorasi struktur tim dua tingkat 8×8 untuk berskala melampaui 10 agent, tetapi belum mengembangkan praktik yang efektif. Saya akan berbagi lebih banyak ketika ada hasil yang konkret…

Alur kerja dev VM0 mengubah cara kami memandang pengembangan perangkat lunak ketika AI menjadi bagian dari tim.

Ketika Anda memperlakukan agent AI sebagai anggota tim alih-alih tool, semuanya jatuh pada tempatnya. GitHub menjadi memori bersama tim Anda. Issue menjadi item pekerjaan. PR menjadi keluaran. Dan Anda menjadi pemimpin tim, berfokus pada arsitektur, arah, dan kualitas selagi tim AI Anda menangani implementasinya.

Begitulah cara kami merilis 404 release dalam 2 bulan. Dan begitulah cara Anda bisa menskalakan pengembangan Anda sendiri dengan AI.

Related Articles

Stay in the loop

// Get the latest insights on AI teammates and collaboration.

SubscribeJoin Discord