Top 3 숏 시그널의 PnL은 시총별로 어떻게 다른가?

Q: 200M-1B 평균 +16%는 너무 높은데, 왜 그런가요?

이 구간은 평소 점수가 중간대인 코인이 드물게 Top 3에 도달한 케이스로 구성됩니다. 평소 점수가 중간대인 코인이 상위로 올라왔다는 건 비정상적인 단기 과열을 의미하고, 그런 과열은 평균적으로 더 강하게 되돌렸다는 게 본 데이터의 해석입니다. 다만 84건은 작은 표본이고 magnitude는 더 긴 기간 검증이 필요합니다.

Q: 소형 코인 (<50M)이 평균 -3%면 점수 Top 3에 소형이 보이면 무시해야 하나요?

평균이 음수인 건 사실이지만 분포 자체는 매우 넓습니다. 평균이 음수라는 건 "이 구간을 무차별로 진입하면 손해"라는 뜻이지 "항상 손해"라는 뜻은 아닙니다. 시총 외에 OI, 펀딩비, RSI 등 추가 필터가 함께 양호한 경우만 후보로 좁히는 접근이 필요합니다.

Q: 점수 시스템에 시총을 직접 반영하면 결과가 좋아지나요?

본 데이터는 그 가능성을 시사하지만 증명하지 않습니다. 200M-1B 보너스를 줘서 시총 효과를 가중치에 녹이면 expected return이 개선될 수 있다는 가설은 매력적이지만, 84건 표본으로 가중치를 튜닝하면 overfit 위험이 큽니다. 더 긴 기간 데이터가 누적된 뒤 백테스트 페이지에서 검증하는 게 옳은 절차입니다.

S Seungju Chae · 2026년 4월 25일 · neutral

#study #factor-analysis #distribution

coinKaster market_history 직접 수집 (Binance USDT 무기한 선물, 2026-04-08 ~ 2026-04-23, rank_position <= 3 n=981)
점수 1~3위 시그널의 24h 후 숏 PnL을 시총 구간별로 분해
200M-1B 구간 (n=84): 승률 65.5% / 평균 +16.01%. 다른 모든 구간 압도
<50M 소형 (n=770): 승률 33.6% / 평균 -3.14%. baseline (35.9% / -0.99%) 보다 나쁨
통념과 정반대: 점수 시스템이 자주 끌어올리는 소형 코인이 가장 약한 숏 후보

결과: 시총 구간별 24h 숏 PnL

시총 구간	n	평균 PnL	승률
<$50M	770	-3.14%	33.6%
$50M-$200M	112	-4.25%	53.6%
$200M-$1B	84	+16.01%	65.5%
시총 데이터 없음	15	-51.41%	13.3%
baseline (전체 universe)	183,462	-0.99%	35.9%

200M-1B 구간이 압도적. 84건 표본이 작긴 하지만 win rate, 평균 PnL 둘 다 큰 차이
<50M 소형은 baseline보다 나쁨. 점수 1~3위에 자주 들어오는데도 net loser
50M-200M는 winrate 53.6%지만 평균 -4.25%. 비대칭 분포 (이긴 거 작게, 진 거 크게)
시총 NULL 구간은 super-micro-cap. 표본 작고 노이즈 큼

왜 소형은 안 되고 중형은 되나?

점수 시스템의 모멘텀 팩터 (RSI, 7d/30d 펌프, OI 변화)는 소형 코인을 항상 상위로 끌어올림
소형은 본질적으로 변동성이 커서 점수 90+ 영역이 일상. 즉 소형의 “Top 3”는 배경 노이즈에 가까움
200M-1B 코인이 점수 Top 3에 드는 사건은 드묾. 평소 점수가 중간대인 코인이 상위로 올라오면 진짜로 비정상적인 과열이라는 뜻
신호 대 노이즈 비율이 다름. 신호 강도가 동일한 시그널이 다른 base rate에서 발생함

점수 시스템에 대한 함의

본 데이터는 점수 시스템이 시총 정보를 충분히 활용하지 못하고 있을 가능성을 시사
현재 공식은 시총을 직접 점수 팩터로 두지 않고 wash 의심 필터에서만 사용
200M-1B 보너스 또는 <50M 페널티가 가중치로 들어가면 평균 기대값 개선 가능
84건 표본이라 통계적 자신감은 약함. 더 긴 기간 검증 후 가중치 변경 검토할 만한 가설

방법론

WITH pairs AS (
  SELECT h1.market_cap,
    ((h1.price - h2.price) / h1.price) * 100 AS pnl
  FROM market_history h1
  JOIN market_history h2 ON h2.symbol = h1.symbol
    AND ABS(h2.ts - (h1.ts + 86400000)) <= 1800000
  WHERE h1.rank_position <= 3
    AND h1.price > 0 AND h2.price > 0
)
SELECT
  CASE WHEN market_cap IS NULL THEN 'unknown'
       WHEN market_cap < 50000000 THEN '<50M'
       WHEN market_cap < 200000000 THEN '50M-200M'
       WHEN market_cap < 1000000000 THEN '200M-1B'
       ELSE '1B+' END AS bucket,
  COUNT(*), AVG(pnl),
  SUM(CASE WHEN pnl > 0 THEN 1 ELSE 0 END) * 100.0 / COUNT(*)
FROM pairs GROUP BY bucket;

rank_position <= 3 필터는 매 스냅샷에서 점수 1~3위만 남김
약 360개 스냅샷 × 3 ≈ 1,080건 잠재 모집단. 24h 후 가격이 매칭 안 되는 케이스 제외하고 981건
시총 분류는 entry 시점 기준. exit 시점 시총은 미고려
거래 비용 미반영

한계

200M-1B 표본 84건, 50M-200M 112건. 통계적 자신감 약함
효과 크기가 크긴 하지만 (200M-1B 평균 +16%) 다른 기간 재측정 필요
표본 기간 15일. 약한 상승 국면 (baseline -0.99%) 한정 결과
1B 이상 구간 부재. 본 표본에서 대형 코인이 점수 Top 3에 드는 사건이 0회
wash 의심 필터로 거른 종목 외에는 추가 클렌징 안 함

200M-1B 평균 +16%는 너무 높은데, 왜 그런가요?

이 구간은 평소 점수가 중간대인 코인이 드물게 Top 3에 도달한 케이스로 구성됩니다. 평소 점수가 중간대인 코인이 상위로 올라왔다는 건 비정상적인 단기 과열을 의미하고, 그런 과열은 평균적으로 더 강하게 되돌렸다는 게 본 데이터의 해석입니다. 다만 84건은 작은 표본이고 magnitude는 더 긴 기간 검증이 필요합니다.

소형 코인 (<50M)이 평균 -3%면 점수 Top 3에 소형이 보이면 무시해야 하나요?

평균이 음수인 건 사실이지만 분포 자체는 매우 넓습니다. 평균이 음수라는 건 “이 구간을 무차별로 진입하면 손해”라는 뜻이지 “항상 손해”라는 뜻은 아닙니다. 시총 외에 OI, 펀딩비, RSI 등 추가 필터가 함께 양호한 경우만 후보로 좁히는 접근이 필요합니다.

점수 시스템에 시총을 직접 반영하면 결과가 좋아지나요?

본 데이터는 그 가능성을 시사하지만 증명하지 않습니다. 200M-1B 보너스를 줘서 시총 효과를 가중치에 녹이면 expected return이 개선될 수 있다는 가설은 매력적이지만, 84건 표본으로 가중치를 튜닝하면 overfit 위험이 큽니다. 더 긴 기간 데이터가 누적된 뒤 백테스트 페이지에서 검증하는 게 옳은 절차입니다.

운영자 관점

소형 (<50M)이 baseline보다 나쁜 게 가장 의외였음. 점수 시스템이 소형을 자주 상위로 올리는데, 그 자체가 진입 시그널이 아니라는 뜻이라 가중치 재설계 검토 가치가 있는 듯. 다만 200M-1B 구간 84건만으로 결론 내리는 건 위험하니 표본이 더 쌓이고 나서 백테스트 탭에서 시총 가중치 추가 효과를 확인하는 게 순서 같음.

투자 조언 아님. 본 글은 스코어링 시스템의 출력을 해석하는 참고 메모.

← 목록으로 돌아가기