Technical Log #1: The Endless Iterations of Cursive RAG Architecture (feat. 3,908 Struggles) (기술 로그 #1: 초서 RAG 아키텍처의 끝없는 반복 작업 기록 - 3,908건의 고군분투)
Hello! My project is still a "work in progress."
안녕하세요! 저의 프로젝트는 여전히 '진행 중'입니다.
I want to be honest: I haven't reached "success" yet. Instead, I am in the middle of a grueling cycle of manual verification and AI-assisted re-processing. I have already gone through 3,908 iterations to fix data inconsistencies, a number that far exceeded my original plan of 2,500.
솔직히 말씀드리면, 아직 '성공'에 도달한 것은 아닙니다. 대신, 저는 지금 수동 검증과 AI를 활용한 재처리라는 고된 반복 작업의 한복판에 있습니다. 데이터 불일치를 해결하기 위해 이미 3,908번의 반복 작업을 거쳤으며, 이는 당초 계획했던 2,500건을 훨씬 넘어선 수치입니다.
🏛️ Architecture Under Construction (구축 중인 아키텍처)
(데이터 흐름도 )
Building a reliable system as a non-coder means constant trial and error. My current architecture is the result of these endless loops with AI:
코딩 전문가가 아닌 입장에서 신뢰할 수 있는 시스템을 만드는 것은 끊임없는 시행착오의 연속입니다. 현재의 아키텍처는 AI와 함께 수없이 반복한 결과물입니다:
Standardization Loop: I am constantly resizing and padding images to 224x224 to minimize AI recognition errors.
표준화 루프: AI의 인식 오류를 줄이기 위해 모든 이미지를 224x224 크기로 맞추는 작업을 반복하고 있습니다.
3-Way Search Refinement: I am fine-tuning how the system merges results from my verified samples, AIHub, and legacy data to find the best "trust balance."
3중 검색 정교화: 검증 데이터, AIHub, 레거시 데이터 사이의 최적의 '신뢰 균형'을 찾기 위해 검색 결과 통합 방식을 다듬고 있습니다.
Self-Healing Tests: I am running scripts like
resume_reembed.pyrepeatedly to ensure the 1.4M character database stays healthy.자가 치유 테스트: 140만 자의 데이터베이스가 건강하게 유지되도록
resume_reembed.py같은 스크립트를 반복해서 구동하며 테스트 중입니다.🚀 Working Side-by-Side with AI (AI와 함께하는 협업)
It's a slow and repetitive journey, but with AI as my partner, I'm moving forward one character at a time.
느리고 반복적인 여정이지만, AI를 파트너 삼아 한 글자씩 앞으로 나아가고 있습니다.
This Workspace UI is where the real struggle happens. I crop the characters, and AI suggests labels. Sometimes it's right, many times it's wrong, and each correction is a step toward a better system.
이 작업 공간(Workspace) UI는 실제 고군분투가 일어나는 곳입니다. 제가 초서를 자르면 AI가 라벨을 추천합니다. 맞을 때도 있지만 틀릴 때도 많으며, 각 교정 작업 하나하나가 더 나은 시스템을 향한 과정입니다.


댓글
댓글 쓰기