티스토리 뷰

반응형

해당 글은 시리즈로 연재되고 있으며

이전 글을 안 읽으셨다면 이전의 글부터 먼저 읽어보길 추천드립니다.

우선 켈리공식 A to Z 시리즈를 시작하기에 앞서...

 

 

 

[켈리공식 A to Z] 1-6. 4가지 경우를 고려한 켈리공식

해당 글은 시리즈로 연재되고 있으며 이전 글을 안 읽으셨다면 이전의 글부터 먼저 읽어보길 추천드립니다. 우선 켈리공식 A to Z 시리즈를 시작하기에 앞서... 켈리공식을 본격적으로 사용해 보

gambari90.com

 

1.6의 경우에서 우리는 4가지 경우를 고려한 켈리공식을 통해 n번째의 경우도 물론 고려를 해서 모델링을 할 수 있었습니다.

 

다만? 좀 더 쉽게 생각 하기위해서 로그에 대해서 생각을 해 봅시다.

우선 효용의 가치에 대해서 우선 먼저 생각해보도록 합시다.

 

같이 읽으면 좋은 글

[켈리공식 A to Z] 효용을 따지기위한 태초의 논문 - 다니엘 베르누이의 상트페테르부르크의 역설(St. petersburg paradox)

 

1000만원이란 돈은 물론 가치가 큰돈입니다.

 

하지만? 이 경우는 어떻게 생각하실까요?

 

A. 자산이 무일푼인 사람에게 +1000만원의 가치

B. 자산이 1000억 있는 사람에게 +1000만원의 가치

C. 자산이 1001억 있는 사람에게 +1000만원의 가치

 

답은 너무 뻔하죠?

같은 1000만원이어도 효용이 다릅니다.

이를 경제학에서는 한계효용체감의 법칙이란 말로도 표현하죠.

함수로 가정할 시 한계효용에 가장 잘 맞는 함수는 무엇일까요?

 

바로 로그함수입니다.

로그함수에서 재미있는 성질이 하나 있습니다.(밑이 1보다 큰...)

로그를 붙이게 되면 아주 큰 수도 적은 수로 변하게 됩니다.

하지만 a > b > 0 일 때 각각 로그를 붙인다고 해서

그렇다고 log a < log b가 되어버리는 일은 없습니다.

무조건 절대적인 값은 log a > log b 가 되어 버리는 상황인 거죠.

 

총 재산

1000만원 vs 1000억1000만원 vs 1001억 1000만원

1000만원 < 1000억1000만원 < 1001억 1000만원

 

여기에 로그를 씌워보겠습니다.

log(1000만원) vs log(1000억 1000만원) vs log(1001억 1000만원)

 

log(1000억 1000만원) 과 log(1001억 1000만원)의 절대적 크기를 비교해보면 어떨까요?

당연히 log를 취했다고 해서 순서가 바뀌지 않습니다.

log(1001억 1000만원)의 크기는 log(1000억 1000만원)보다 클 것입니다. 

하지만? 로그를 취한 그 차이 자체의 크기는? 생각보다 없을 겁니다.

이 의미는 1001억 1000만원의 효용이 1000억 1000만원보다 더 당연히 효용이 절대적으로는 큰 게 맞으나

1000억 1000만원과 1001억 1000만원의 효용은 비슷하다는 의미입니다.

(비슷하지만 눈꼽만큼 1001억 1000만원의 효용이 1000억 1000만원보다 더 크다)

log(1000만원) < log(1000억 1000만원) ≒< log(1001억 1000만원)

 

이런 당연한 이야기를 왜 하느냐?

로그 함수의 이런 성질을 통해서 좀 더 컴퓨터가 계산을 쉽게 할 수 있기 때문입니다.

 

지난 시간에서 예시를 들었습니다.

f는 투자 비율이고

f>0보다 크다고 가정해 보겠습니다.

f는 우리가 베팅할 금액이 적어도 0 이상이란 의미를 뜻합니다.

이는 기댓값이 +인 상황을 의미합니다.

그리고 기존함수에서 y= g(f)

f1 과  f2로 값을 넣었을 때(0 <f1 <f2)

g(f1) < g(f2)라면?

 

log를 씌우면 어떻게 될까요?

log(y) = log(g(f))

여기에 f1 < f2 일 때 g(f1) < g(f1)라면?

log(g(f1)) < log(g(f2))라는 것을 의미합니다.

 

즉 양변에 로그를 취한다고 해서 비슷하긴 하지만

로그를 씌운 것(효용)의 최댓값이 변하지 않는다는 것을 의미합니다.

그렇다면 이것이 왜 중요할까요?

로그 함수의 성질을 이용하면 기존에 곱의 문제를 합의 문제로 바꿀 수 있기 때문입니다.

컴퓨터가 계산할 때 곱 연산이 많으면 계산을 하기 힘들어합니다.

합의 연산을 하면 컴퓨터가 계산하기 쉽게 만들어줍니다.

 

어차피 우리는 최대기하수익률을 원하기 때문에 베팅 비율

g(f)가 최고가 되는 f의 max값 자체를 계산하는 것이 중요합니다

 

즉, g(f)가 최고가 되는 f의 max값이나

log(g(f))가 최고가 되는 f의 max값은 똑같습니다.

 

기존에 배운 위의 식에서 양변에 log를 취해볼까요?

 

 

 

 

더군다나 Pi가 동일하다면?

이렇게 된다면 과연 어떻게 될까요?

만약 4가지 경우의 Pi가 25%씩 독립동일분포고

만약 5가지 경우의 Pi가 20%씩 독립동일분포고

....

만약 k가지 경우의 Pi가 (100/k)% 씩 독립동일분포라면?

그 빈도(확률)에 영향을 받기보다 순배당률(수익의 결과값)에만 영향을 받는다는 것입니다.

k항 분포가 독립동일 분포라면? 순배당률(수익의 결과값)에만 영향을 받는다는 것입니다.

(독립동일 분포라고 함은 Pi가 일어날 확률은 각각 동일하고 Pi사건이 일어나면 나머지 사건은 일어나지 않는다는 의미입니다.)

이럴 때 Pi(빈도)는 동일하기 때문에 무시해도 괜찮은 상수가 되는 것이죠.

 

물론 관찰을 해보니 1년 전 사건보다 최근 일자에 가중치를 둔다거나?

혹은 인과관계를 파악할 만한 일이 있어서 그것을 반영할 수 있다고 한다면?

 

최근 빈도수에 가중치를 주게 된다면 일일이 하나하나 계산해서 귀찮은 모델링을 통해 해결할 수 있지만

A사건이 일어났기 때문에 B사건이 일어날 확률은?(인과관계를 파악할 수는 있을까??)

주식과 관련한 시계열 분포에선 어떤 게 어떻게 어떤 사건 때문에

다음 사건에서 인과관계로 가중치가 더해졌는지 파악하기 힘들지 않을까요?

관련된 내용은 1-7.의 글 내용을 다시 참조하면 좋을 것 같습니다.

 

다음 글에서는 이산적인 분포가 아니라 연속적인 경우에 대해서 어떻게 켈리공식에 대해서 접근을 할 것인지 가장 기본적인 것부터 설명을 해보도록 하겠습니다.

 

다음 글

2-1. 표준편차에 대한 이해

반응형