회사에서 자체 문서 기반 챗봇 만들고 있는데 벡터 데이터베이스를 뭘로 할지 한 달째 고민이네요. 핑크핑크로는 Pinecone이 괜찮다길래 봤는데 비용이 생각보다 많이 드는 거 같고, 그렇다고 Weaviate나 Milvus 같은 오픈소스 쓰자니 직접 운영이 얼마나 복잡할지 모르겠어요.
지금 문서가 한 500개 정도인데 스케일링을 고려하면 뭐가 현실적인 선택일까요? 프로토타입으로 빠르게 만들어야 하는데 너무 무거운 솔루션 고르기 싫거든요. 혹시 이미 해보신 분들은 어떤 기준으로 선택하셨나요?
문서 500개면 일단 Pinecone 프리 티어부터 시작해보는 게 낫지 않을까요? 나중에 스케일링 필요하면 그때 옮기면 되고요. 오픈소스는 프로토타입 단계에선 진짜 오버킬인 것 같아요. 저도 비슷한 상황에서 Pinecone으로 빠르게 만들었는데 나중에 필요하면 Qdrant 같은 가벼운 오픈소스로 마이그레이션하는 게 훨씬 간단했거든요.
AI새싹
저도 비슷한 상황이었는데 일단 Pinecone으로 프로토타입 만들고 나중에 마이그레이션하는 게 현실적이더라고요. 500개 정도면 비용도 크게 안 들고요. 오픈소스는 진짜 운영이 복잡해요 ㅠㅠ
궁금하면
초기 단계면 Pinecone 프리 티어로 시작하고 나중에 옮기는 게 낫더라고요. 오픈소스는 정말 관리 비용이 생각보다 크거든요. 저도 처음엔 Milvus 했다가 DevOps 담당이 필요해서 결국 Pinecone으로 옮겼어요. 문서 500개면 프리 티어 충분할 거 같은데 한번 써보시고 스케일링은 나중에 고민해도 될 듯합니다.
AI새싹
저도 같은 고민했는데 결국 Pinecone으로 시작했어요. 비용 걱정하셨다면 프리티어로 먼저 프로토타입 만들어보고 스케일 확실해지면 전환해도 늦지 않을 것 같습니다. 500개 문서면 아직 프리 범위 안에서 충분히 테스트할 수 있을 거든요. 다만 Milvus나 Weaviate는 나중에 자체 서버로 옮기려면 초기 설계가 중요한데, 프로토타입 단계라면 먼저 Pinecone으로 빠르게 검증하고 나중에 필요하면 마이그레이션하는 게 현실적이라고 봅니다. 저는 이 방식으로 했는데 후회 없었어요.
흐름타는개발자
프로토타입이면 차라리 Qdrant 써보세요. 가볍고 셀프호스팅도 간단한데 Pinecone보다 훨씬 저렴해요. 문서 500개 정도면 PostgreSQL + pgvector도 충분히 먹힐 수 있고요. 초기엔 심플하게 가다가 나중에 스케일 필요하면 옮기는 게 낫더라고요.
딥러너
저도 비슷한 상황이었는데 결국 Pinecone으로 시작했어요. 프로토타입 단계면 무료 티어로 충분하더라고요. 나중에 비용이 문제되면 그때 마이그레이션 생각해도 늦지 않을 것 같습니다.
딥러닝장인
프로토타입이면 Pinecone 무료 tier로 시작하는 게 낫더라고요. 500개 정도면 충분하고 나중에 필요할 때 확장하면 돼요. 오픈소스는 운영 비용이 생각보다 커요.