Skip to content

⚙️ [기능추가][AI] 국장 주가데이터 수집 파이프라인 추가 #372

@twq110

Description

@twq110

📝 현재 문제점

  • 국장 매매 자동화를 진행하기 전에 국내 주식 주가데이터 수집 기반이 먼저 필요합니다.
  • 현재 AI/트레이딩 파이프라인은 가격 데이터 기반으로 feature engineering, 모델 추론, 포트폴리오 판단을 수행합니다.
  • 하지만 국내 주식 종목의 OHLCV 데이터를 안정적으로 수집하고 저장하는 구조가 아직 정리되어 있지 않습니다.
  • 신규 매매 계정 생성, 국장 주문 API 연동, 실매매 루틴 구현보다 먼저 국장 주가데이터 수집 파이프라인을 구축해야 합니다.

🛠️ 해결 방안 / 제안 기능

  • data_collector 작업 공간을 기준으로 국내 주식 종목의 일봉 OHLCV 데이터를 수집하는 기능을 추가합니다.
  • 우선 pykrx 또는 FinanceDataReader 기반으로 KOSPI/KOSDAQ 종목 데이터를 수집합니다.
  • 수집 데이터는 기존 AI/트레이딩 파이프라인에서 사용할 수 있는 형태로 저장합니다.
  • 수집 실패 종목은 전체 배치를 중단시키지 않고 로그로 남기도록 합니다.
  • 결측치, 거래정지, 신규상장, 상장폐지 종목에 대한 기본 처리 방식을 정의합니다.

⚙️ 작업 내용

  • 작업 공간을 data_collector로 설정
  • data_collector 내부 디렉터리 구조 설계
    • 수집 모듈
    • 설정 파일
    • 저장 경로
    • 로그 경로
    • 실행 스크립트
  • 국장 주가데이터 수집 라이브러리 검토
    • pykrx
    • FinanceDataReader
    • KRX 데이터
    • 추후 증권사 API 연동 가능성
  • KOSPI/KOSDAQ 종목 리스트 수집 기능 구현
  • 단일 종목 일봉 OHLCV 수집 함수 구현
  • 여러 종목 배치 수집 함수 구현
  • 저장 포맷 결정
    • DB 저장
    • parquet/csv 저장 여부 검토
  • 기존 feature engineering 입력 컬럼과 정합성 확인
    • date
    • ticker
    • open
    • high
    • low
    • close
    • volume
    • trading_value
  • 결측치/거래정지/신규상장/상장폐지 종목 처리
  • 수집 실패 종목 로그 기록
  • 샘플 종목 기준 수집 테스트
  • 사용법 문서 또는 README 작성

🙋‍♂️ 담당자

  • 백엔드: 미정
  • 프론트엔드: 해당 없음
  • 디자인: 해당 없음
  • AI : 석재빈

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions