Top 3 숏 시그널의 PnL은 시총별로 어떻게 다른가?
- coinKaster
market_history직접 수집 (Binance USDT 무기한 선물, 2026-04-08 ~ 2026-04-23,rank_position <= 3n=981) - 점수 1~3위 시그널의 24h 후 숏 PnL을 시총 구간별로 분해
- 200M-1B 구간 (n=84): 승률 65.5% / 평균 +16.01%. 다른 모든 구간 압도
- <50M 소형 (n=770): 승률 33.6% / 평균 -3.14%. baseline (35.9% / -0.99%) 보다 나쁨
- 통념과 정반대: 점수 시스템이 자주 끌어올리는 소형 코인이 가장 약한 숏 후보
결과: 시총 구간별 24h 숏 PnL
| 시총 구간 | n | 평균 PnL | 승률 |
|---|---|---|---|
| <$50M | 770 | -3.14% | 33.6% |
| $50M-$200M | 112 | -4.25% | 53.6% |
| $200M-$1B | 84 | +16.01% | 65.5% |
| 시총 데이터 없음 | 15 | -51.41% | 13.3% |
| baseline (전체 universe) | 183,462 | -0.99% | 35.9% |
- 200M-1B 구간이 압도적. 84건 표본이 작긴 하지만 win rate, 평균 PnL 둘 다 큰 차이
- <50M 소형은 baseline보다 나쁨. 점수 1~3위에 자주 들어오는데도 net loser
- 50M-200M는 winrate 53.6%지만 평균 -4.25%. 비대칭 분포 (이긴 거 작게, 진 거 크게)
- 시총 NULL 구간은 super-micro-cap. 표본 작고 노이즈 큼
왜 소형은 안 되고 중형은 되나?
- 점수 시스템의 모멘텀 팩터 (RSI, 7d/30d 펌프, OI 변화)는 소형 코인을 항상 상위로 끌어올림
- 소형은 본질적으로 변동성이 커서 점수 90+ 영역이 일상. 즉 소형의 “Top 3”는 배경 노이즈에 가까움
- 200M-1B 코인이 점수 Top 3에 드는 사건은 드묾. 평소 점수가 중간대인 코인이 상위로 올라오면 진짜로 비정상적인 과열이라는 뜻
- 신호 대 노이즈 비율이 다름. 신호 강도가 동일한 시그널이 다른 base rate에서 발생함
점수 시스템에 대한 함의
- 본 데이터는 점수 시스템이 시총 정보를 충분히 활용하지 못하고 있을 가능성을 시사
- 현재 공식은 시총을 직접 점수 팩터로 두지 않고 wash 의심 필터에서만 사용
- 200M-1B 보너스 또는 <50M 페널티가 가중치로 들어가면 평균 기대값 개선 가능
- 84건 표본이라 통계적 자신감은 약함. 더 긴 기간 검증 후 가중치 변경 검토할 만한 가설
방법론
WITH pairs AS (
SELECT h1.market_cap,
((h1.price - h2.price) / h1.price) * 100 AS pnl
FROM market_history h1
JOIN market_history h2 ON h2.symbol = h1.symbol
AND ABS(h2.ts - (h1.ts + 86400000)) <= 1800000
WHERE h1.rank_position <= 3
AND h1.price > 0 AND h2.price > 0
)
SELECT
CASE WHEN market_cap IS NULL THEN 'unknown'
WHEN market_cap < 50000000 THEN '<50M'
WHEN market_cap < 200000000 THEN '50M-200M'
WHEN market_cap < 1000000000 THEN '200M-1B'
ELSE '1B+' END AS bucket,
COUNT(*), AVG(pnl),
SUM(CASE WHEN pnl > 0 THEN 1 ELSE 0 END) * 100.0 / COUNT(*)
FROM pairs GROUP BY bucket;
rank_position <= 3필터는 매 스냅샷에서 점수 1~3위만 남김- 약 360개 스냅샷 × 3 ≈ 1,080건 잠재 모집단. 24h 후 가격이 매칭 안 되는 케이스 제외하고 981건
- 시총 분류는 entry 시점 기준. exit 시점 시총은 미고려
- 거래 비용 미반영
한계
- 200M-1B 표본 84건, 50M-200M 112건. 통계적 자신감 약함
- 효과 크기가 크긴 하지만 (200M-1B 평균 +16%) 다른 기간 재측정 필요
- 표본 기간 15일. 약한 상승 국면 (baseline -0.99%) 한정 결과
- 1B 이상 구간 부재. 본 표본에서 대형 코인이 점수 Top 3에 드는 사건이 0회
- wash 의심 필터로 거른 종목 외에는 추가 클렌징 안 함
200M-1B 평균 +16%는 너무 높은데, 왜 그런가요?
이 구간은 평소 점수가 중간대인 코인이 드물게 Top 3에 도달한 케이스로 구성됩니다. 평소 점수가 중간대인 코인이 상위로 올라왔다는 건 비정상적인 단기 과열을 의미하고, 그런 과열은 평균적으로 더 강하게 되돌렸다는 게 본 데이터의 해석입니다. 다만 84건은 작은 표본이고 magnitude는 더 긴 기간 검증이 필요합니다.
소형 코인 (<50M)이 평균 -3%면 점수 Top 3에 소형이 보이면 무시해야 하나요?
평균이 음수인 건 사실이지만 분포 자체는 매우 넓습니다. 평균이 음수라는 건 “이 구간을 무차별로 진입하면 손해”라는 뜻이지 “항상 손해”라는 뜻은 아닙니다. 시총 외에 OI, 펀딩비, RSI 등 추가 필터가 함께 양호한 경우만 후보로 좁히는 접근이 필요합니다.
점수 시스템에 시총을 직접 반영하면 결과가 좋아지나요?
본 데이터는 그 가능성을 시사하지만 증명하지 않습니다. 200M-1B 보너스를 줘서 시총 효과를 가중치에 녹이면 expected return이 개선될 수 있다는 가설은 매력적이지만, 84건 표본으로 가중치를 튜닝하면 overfit 위험이 큽니다. 더 긴 기간 데이터가 누적된 뒤 백테스트 페이지에서 검증하는 게 옳은 절차입니다.
운영자 관점
소형 (<50M)이 baseline보다 나쁜 게 가장 의외였음. 점수 시스템이 소형을 자주 상위로 올리는데, 그 자체가 진입 시그널이 아니라는 뜻이라 가중치 재설계 검토 가치가 있는 듯. 다만 200M-1B 구간 84건만으로 결론 내리는 건 위험하니 표본이 더 쌓이고 나서 백테스트 탭에서 시총 가중치 추가 효과를 확인하는 게 순서 같음.
투자 조언 아님. 본 글은 스코어링 시스템의 출력을 해석하는 참고 메모.