분류 전체보기 51

패스트캠퍼스 환급챌린지 : 6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지 강의 최종 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. 🙌 강의 최종 후기 - [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 1. 학습 인증샷1) 학습 통계 기록 2) 공부 인증샷 3장 이상 2. 최종 챌린지 후기 1. 환급챌린지에 참여한 이유는 무엇이었는지? 50일의 여정이 끝나고 다시 이런 후기를 쓰게 되었습니다. 제가 환급챌린지에 참여한 이유는 단순히 ‘돈을 돌려받는다’는 금전적인 이유 때문만은 아니었습니다. 사실 온라인 강의는 언제든 들을 수 있고, 집에서도 편하게 강의를 들 을 수 있다는 장점이 있긴 하지만 반면, 동시에 언제든 다른 일이 있으면 미룰 수 있고, 한 번 미루다 보면 그것이 습관이 ..

챌린지 2025.09.09

패스트캠퍼스 환급챌린지 50일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. 🎯 토익 스피킹 연습 서비스 만들기 中 로컬 LLM 개발 환경 - ollama로 로컬에서 LLM 돌려보기GPT(API 기반) vs 로컬 LLM(Ollama 등) 비교와 로컬 환경에서의 장점🔹 GPT (클라우드 API 기반) 이용장점최신/고성능 모델 접근 가능: GPT-4, GPT-4o 등 클라우드에서만 제공되는 초거대 모델 사용 가능.안정성 & 유지보수 불필요: 모델 업데이트, 튜닝, 서버 관리 등을 OpenAI에서 책임.에코시스템/도구 연계: ChatGPT Plugins, API, Playground 등과 쉽게 연동.높은 품질 & 지식 기반: 최신 데이터 기반, 일관된 성능.단점비용 발생: 토큰 단위 과금. 요청량 많으면 비용이 빠..

챌린지 2025.08.19

패스트캠퍼스 환급챌린지 49일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. ✳ GPT-4 기반 E2E 명함 정보추출 📌개인정보 추출과 가드레일GPT-4 기반 E2E 명함 정보 추출 1) 실습 목적명함 이미지로부터 이름, 직책, 회사, 이메일, 전화번호 등 핵심 필드를 End-to-End로 추출하는 방법 학습.전통적 “OCR → 텍스트 → 규칙기반 후처리” 대신, GPT-4(Vision) 한 번의 추론으로 구조화된 JSON을 얻는 접근 이해.2) 실습 절차 개요환경 준비: 라이브러리 설치, API 키 로딩, (Colab 기준) 구글 드라이브 마운트.데이터 준비: 명함 이미지 업로드 및 확인.E2E 추론: GPT-4 계열(이미지 입력 지원) 모델에 명함 이미지와 지시문을 함께 전달.출력: 모델이 반환하는 J..

챌린지 2025.08.18

패스트캠퍼스 환급챌린지 48일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. 🎯 텍스트 Recognition 실습 목표: 명함/문서 이미지에서 텍스트를 추출하고 구조화(JSON)까지 만드는 전체 파이프라인을 익힌다.환경: OpenCV, EasyOCR, PaddleOCR, Tesseract(pytesseract), OpenAI Vision 사용.(Colab에서 한글은 tesseract-ocr-kor 필요, EasyOCR–Pillow 버전 호환 주의)접근 방식Template Matching(OpenCV): 로고/아이콘 등 특정 패턴 위치 탐지(영역 힌트용, OCR 자체 아님).일체형 OCREasyOCR: 설치 간단, 다국어 지원, 프로토타입에 적합.PaddleOCR: 정확도/속도 우수, GPU 활용 쉬움, 서비스 지..

챌린지 2025.08.17

패스트캠퍼스 환급챌린지 47일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. 🎯 텍스트 Detection 실습 0. 환경 준비tesseract-ocr, tesseract-ocr-kor 설치easyocr, paddleocr, pytesseract 등 OCR 관련 라이브러리 설치.env 파일에서 OpenAI API 키 불러오기1. 바운딩 박스 개념텍스트 영역은 (x, y, w, h) 형태의 사각형 박스로 표현시각화를 통해 텍스트 검출 개념 이해2. 전통적 텍스트 검출 방식연결요소(Connected Components): 에지/이진화 후 연결된 픽셀 그룹 찾기컨투어(Contours): 외곽선을 추적하여 텍스트 영역 감지박스 병합: 같은 행에 인접한 박스들을 하나로 합치기박스 확장: 텍스트 절단 방지 위해 약간의 패딩 ..

챌린지 2025.08.16

패스트캠퍼스 환급챌린지 46일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. 📄 광학문자인식(OCR)의 이해1. OCR이란?정의이미지, 손글씨, 인쇄된 텍스트를 인식하여 디지털 텍스트로 변환하는 기술예) 종이 문서 스캔 후 디지털 변환, 설문지·영수증 데이터 자동 추출2. OCR 프로세스1) 이미지 전처리 (Image Preprocessing)목적: 텍스트 인식 정확도를 높이기 위해 입력 이미지를 사전에 최적화주요 기법크기 조정: OCR에 맞게 이미지 크기를 조정 (리샘플링, 비율 유지)노이즈 제거: 불필요한 잡음 제거 (Gaussian, Median, Bilateral Filter)이진화: 픽셀 값을 흑백으로 변환해 텍스트와 배경 구분 (Otsu’s method 등)이미지 자르기: 텍스트가 포함된 주요 영역만..

챌린지 2025.08.15

패스트캠퍼스 환급챌린지 45일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. ✨ 디지털 명함지갑 - 이미지 Prompting 이번에 진행한 CGPT-4 기반 이미지 Prompting 실습은 단순한 텍스트 프롬프트 실험을 넘어, 이미지와 텍스트를 결합한 다양한 활용 방법을 직접 체험해볼 수 있는 꽤나 풍부한 학습 경험이었습니다. 특히, OpenAI의 gpt-4o 계열 모델을 이용하여 이미지 인식, 질문 응답, 캡셔닝, 멀티이미지 비교, 포인팅 프롬프트, 수학 문제 풀이, 그리고 Few-shot·Chain-of-Thought 조합까지 전 과정을 실습하면서, 모델이 시각 정보를 어떻게 이해하고 언어로 변환하는지를 단계별로 살펴볼 수 있었습니다.우선 환경 세팅 과정에서는 Colab에서 구글 드라이브를 마운트하고..

챌린지 2025.08.14

패스트캠퍼스 환급챌린지 44일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. ❇️ 디지털 명함지갑 디지털 명함지갑이란?종이 명함 대신 디지털 방식으로 명함을 저장·관리하는 애플리케이션명함 스캔 및 저장: 사진 촬영 → OCR(광학 문자 인식) 기술로 텍스트 자동 추출·저장검색 및 정렬: 이름, 회사명, 직함으로 검색하거나 카테고리별 정렬 가능분석 및 통계: 교환한 명함 수, 카테고리별 명함 수 등 데이터 분석 및 네트워크 통계 작성디지털 명함지갑의 장점접근성 향상언제든 명함을 검색·확인 가능데이터 백업스캔 정보가 디지털 형태로 저장되어 원본 분실 시에도 확인 가능정리의 간편함체계적으로 정리 가능손쉬운 공유복사하여 다른 사람에게 쉽게 전달 가능필요한 기술1. 텍스트 검출 (Text Detection)이미지에서 텍..

챌린지 2025.08.13

패스트캠퍼스 환급챌린지 43일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. 🎯 이미지 기계번역기 서비스 구현 실습파파고 앱의 핵심 기능 구현1. 번역 기능(GPT4 API 이용)제로샷 번역도메인 정보를 추가하여 번역 품질 개선도메인 및 단어사전 정보를 추가하여 번역 품질 개선Embedding API를 활용한 도메인 추정2. 사용자 인터페이스Text to Text 번역을 위한 콘솔Image to Text 번역을 위한 카메라 인풋3. Streamlit App 배포번역 기능 및 사용자 인터페이스 통합(Integration)Ngrok 활용 # 호환 세트 설치: httpx 0.28.1 + 최신 openai + Streamlit 최신대(>=1.38) + TF/numba 친화 NumPy 1.26.x!pip install -..

챌린지 2025.08.12

패스트캠퍼스 환급챌린지 42일차 : [6개 AI 프로덕트로 완성하는 LLM/LMM 서비스 개발의 모든 것 : 프롬프트 엔지니어링부터 멀티모달까지] 강의 후기

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. ✨ 이미지 기계번역의 성능 평가 1. OCR 성능평가 개요검출기 평가: 문자를 얼마나 정확히 찾아내고 위치를 파악하는지 측정.IoU(Intersection over Union) 기본 지표 → GIoU, DIoU, CIoU로 발전 (거리·종횡비 고려).인식기 평가: 이미지 내 텍스트를 얼마나 정확히 읽는지 평가.정확도, 정밀도(Precision), 재현율(Recall), F1-score, H-Mean, CER(문자 오류율), WER(단어 오류율).Overall 평가: 검출 + 인식 전 과정 성능, 레이아웃 순서 정확도, 처리속도(TPS)까지 종합.2. 성능평가지표와 현장 평가의 괴리엔지니어는 수치 지표(BLEU, CER 등)로 판단,비즈니..

챌린지 2025.08.11