동일 프롬프트로 바이브 코딩 에이전트 4종 비교해보기 (Lovable, Gemini, Rork, Flowith)
새로 접한 서비스들을 테스트해볼 겸, 서로 다른 강점을 지닌 4가지 에이전트로 바이브 코딩을 해봤어요. 예전에 AI 프로토타이핑 서비스(v0, Lovable, Replit, Bolt, Tempo, Mocha)들을 딥리서치로 비교한 적 있었는데, 이번에는 구현까지 해서 비교했습니다.
- Lovable: AI 프로토타이핑 서비스 선두주자 중 하나. 유려한 UI를 빠르게 구현해줌. 즉시 퍼블릭 배포 가능
- Gemini App Build: Google AI Studio에서 사용. 무료로 Gemini API 호출하는 앱 만들 수 있음. 채팅 수 제한 없음
- Rork: 최초로 모바일 앱 시뮬레이터를 내장한 바이브 코딩 서비스. 스마트폰에서 앱으로 테스트 가능
- Flowith Neo: 24시간 돌아가는 슈퍼에이전트. 코딩을 포함한 다양한 작업을 멀티에이전트로 할 수 있음
모두 동일하게, 지인들과 함께 자체 개발해서 진행했던 도움 요청 기술 훈련 워크숍의 핸드아웃을 넣고 "혼자 훈련할 수 있는 시뮬레이션 앱을 만들어달라"고 했습니다.

그리고 각 서비스를 다음 7개 기준(총 70점 만점)으로 평가했어요. 그사이 바이브 코딩 경험이 더 쌓인 덕에 기준을 자체 개발(?)할 수 있었네요.
구현 과정
- 효율성: 동작하는 앱을 만들기까지 내 개입이 적은가
- 편의성: 테스트와 디버그가 용이한가
- 속도: 구현 속도가 빠른가
- 비용: 구현에 드는 비용이 적은가
구현 결과
- 기능성: 기능이 기대를 충족하며 풍부한가
- 사용성: 만들어진 앱의 UI/UX가 직관적이고 예쁜가
- 효과성: 실제로 도움 요청 기술 훈련에 도움되는가
평과 결과 요약
평가를 표로 요약했습니다.

- 구현 과정: Lovable > Gemini >> Rork >>>> Flowith
- 구현 결과: Lovable ~= Flowith > Gemini = Rork
Lovable과 Gemini는 둘다 첫턴에 완성했지만 Gemini는 혼자 버그픽스 한번 해서 완성한 거고요. Rork는 (에러 메시지 복붙 기능 사용한) 버그픽스 2차례 후 3턴에 완성했습니다. 그리고 Flowith는 수차례 제가 개입하고 스스로도 고치려고 노력했지만 완성 못했습니다. 다만 중간에 계속 프리뷰가 나와서 중간 결과는 볼 수 있었어요.
좀 사심이 담겨있을 순 있지만 전반적으로 Lovable이 1황이네요. 그래도 각자 특장점들은 확실히 있었습니다.
- Gemini: LLM 호출을 바로 테스트할 수 있는 경험이 특별함
- Rork: 모바일 앱을 폰에서 바로 테스트하니 앱만의 맛이 있음
- Flowith: 추가 리서치를 제대로 함. 완성만 해줬더라면...
기대했던 Flowith는 중간 결과는 좋았지만, 아직 바이브 코딩의 메인 툴로 쓰기에는 영 아니네요. 무엇보다 혼자 채팅 메시지 기반이 아닌 크레딧 기반이라 비용이 너무 많이 들어요.
참고로 구현 과정은 이번뿐 아니라 제 전체 경험을 통틀어 평가했어요. Rork는 처음이고, 러버블은 여러 번, Gemini와 Flowith는 3개씩 만들어봤습니다.
아래는 각 서비스별 평가와 동작 화면입니다. 어떤 서비스인지도 보여드리려고 일부러 구현 과정도 같이 촬영했습니다.
🥇 1등 Lovable - 63점 (첫턴에 완성)
구현 과정
- 효율성: 9
- 편의성: 9
- 속도: 10
- 비용: 7
그냥 다 잘함. 첫턴 구현이 가장 빠르고 깔끔함. 에러 메시지 기반 자동 버그픽스 편리. 무료 비주얼 에딧과 버그픽스 좋음. 코드 수정도 유료는 그자리에서, 무료는 깃헙 연동해서 가능. 즉시 퍼블릭 배포도 좋음.
구현 결과
- 기능성: 9
- 사용성: 10
- 효과성: 9
UI는 역시 예쁘고 흠잡을 데 없음. 기능이 풍부하진 않지만 창의적으로 핸드아웃 해석해서 직관적이고, 있을 기능은 다 있었음.
3단계를 항상 따라야 한다는 건 단점. 시뮬레이션도 단순한 룰 기반이었지만 적절했음. 여기에 LLM을 비롯해 다른 서비스에서 좋았던 점들만 붙이면 되겠다 싶었음.