Top 3 숏 시그널의 PnL은 시총별로 어떻게 다른가?

· · neutral

결과: 시총 구간별 24h 숏 PnL

시총 구간n평균 PnL승률
<$50M770-3.14%33.6%
$50M-$200M112-4.25%53.6%
$200M-$1B84+16.01%65.5%
시총 데이터 없음15-51.41%13.3%
baseline (전체 universe)183,462-0.99%35.9%

왜 소형은 안 되고 중형은 되나?

점수 시스템에 대한 함의

방법론

WITH pairs AS (
  SELECT h1.market_cap,
    ((h1.price - h2.price) / h1.price) * 100 AS pnl
  FROM market_history h1
  JOIN market_history h2 ON h2.symbol = h1.symbol
    AND ABS(h2.ts - (h1.ts + 86400000)) <= 1800000
  WHERE h1.rank_position <= 3
    AND h1.price > 0 AND h2.price > 0
)
SELECT
  CASE WHEN market_cap IS NULL THEN 'unknown'
       WHEN market_cap < 50000000 THEN '<50M'
       WHEN market_cap < 200000000 THEN '50M-200M'
       WHEN market_cap < 1000000000 THEN '200M-1B'
       ELSE '1B+' END AS bucket,
  COUNT(*), AVG(pnl),
  SUM(CASE WHEN pnl > 0 THEN 1 ELSE 0 END) * 100.0 / COUNT(*)
FROM pairs GROUP BY bucket;

한계

200M-1B 평균 +16%는 너무 높은데, 왜 그런가요?

이 구간은 평소 점수가 중간대인 코인이 드물게 Top 3에 도달한 케이스로 구성됩니다. 평소 점수가 중간대인 코인이 상위로 올라왔다는 건 비정상적인 단기 과열을 의미하고, 그런 과열은 평균적으로 더 강하게 되돌렸다는 게 본 데이터의 해석입니다. 다만 84건은 작은 표본이고 magnitude는 더 긴 기간 검증이 필요합니다.

소형 코인 (<50M)이 평균 -3%면 점수 Top 3에 소형이 보이면 무시해야 하나요?

평균이 음수인 건 사실이지만 분포 자체는 매우 넓습니다. 평균이 음수라는 건 “이 구간을 무차별로 진입하면 손해”라는 뜻이지 “항상 손해”라는 뜻은 아닙니다. 시총 외에 OI, 펀딩비, RSI 등 추가 필터가 함께 양호한 경우만 후보로 좁히는 접근이 필요합니다.

점수 시스템에 시총을 직접 반영하면 결과가 좋아지나요?

본 데이터는 그 가능성을 시사하지만 증명하지 않습니다. 200M-1B 보너스를 줘서 시총 효과를 가중치에 녹이면 expected return이 개선될 수 있다는 가설은 매력적이지만, 84건 표본으로 가중치를 튜닝하면 overfit 위험이 큽니다. 더 긴 기간 데이터가 누적된 뒤 백테스트 페이지에서 검증하는 게 옳은 절차입니다.

운영자 관점

소형 (<50M)이 baseline보다 나쁜 게 가장 의외였음. 점수 시스템이 소형을 자주 상위로 올리는데, 그 자체가 진입 시그널이 아니라는 뜻이라 가중치 재설계 검토 가치가 있는 듯. 다만 200M-1B 구간 84건만으로 결론 내리는 건 위험하니 표본이 더 쌓이고 나서 백테스트 탭에서 시총 가중치 추가 효과를 확인하는 게 순서 같음.


투자 조언 아님. 본 글은 스코어링 시스템의 출력을 해석하는 참고 메모.