(빅데이터를 지배하는) 통계의 힘

 


통계학이 최강의 학문이다 
 
(빅데이터를 지배하는)  통계의 힘

저자 니시우치 히로무 지음

역자 신현호 옮김

출판사 비전코리아 | 2013.07.30

형태 판형 규격外 |  페이지 수 295

 

 

비지니스를 하시는 분은 물론

무언가의 효과를 알고 싶어하는 분들은 한번 읽어볼만한 책입니다.

중반이후는 통계학적 설명이 나오면서 이해가 좀 힘들지만

통계학의 중요성과 필요성은 충분히 공감할 것 같습니다.

 

빅데이터 시대의 통계는 이제 삶에서 때어낼 수 없는 현상이 되고 있고

이해를 안해도 되는 시대에서 이해 해야만 하는 시대로 넘어가고 있지 않나 생각됩니다.

아래는 제가 필요한 것만 쓴 것이라 앞뒤가 안맞습니다. 읽으실 때 참고해 주세요

 

[본문]


통계 분석은 다음 질문에 답할 수 있어야 한다

. 어떤 요인을 변화시켜야 이익이 향상될까?

. 그런 변화를 일으키는 행동이 실제로 가능한가?
. 그에 따르는 비용이 이익을 상회할까?

 

'충분한 데이터'를 바탕으로 '적절한 비교'를 하는 통계적 인과추론의 기초만 몸에 배어 있으며
경험이나 감을 뛰어넘는 비즈니스 비결을 찾아낼 수 있다.

 

무조건 많은 데이타?
우선은 올바른 판단을 위해 필요한 최소의 데이타를 다룰 것 


유효한 조사 범위
전체의 0.5% 무작위 추출 조사 #임의화

 

통계 조사 단계
조사 -> 가설 -> 2차조사(심층, 전수 조사) -> 증명 혹은 가설 -> 3차 조사(심층, 전수) -> 증명 혹은 가설
# 처음부터 모두 알아낼 수는 없다. 

관찰과 실험의 차이
관찰 : 대상을 보고 측정하여 진실을 밝히는 것
실험 : 다양하게 조건을 바꾼 상태에서 대상을 보고 측정해 진실을 밝히는 것


임의화. 랜덤 : 일체의 의도가 없는 상태
# 임의화 했다면 그 결과는 통계적으로 일반화 할 수 있다.


오차에 접근하는 세가지 방법
. 가설에 의한 이론 모델
. 실험 중 원하는 결과로만 보여준다
. 임의화하여 인과관계를 확률적으로 표현

 
A/B테스트

. 임의화한 대상에게 2가지 상황을 주고 그 결과를 비교 분석하는 방법
. 오차를 고려해 측정해야 한다
. 카이제곱 검정 : 의미가 있는지 없는지 해석
. P- : 실제는 아닌데 오차나 우연으로 데이터가 같은 확율 (작을 수록 우연 아님. 약5% 이하)


모든 조건을 임의화하면 평균적으로 비교하려는 두 그룹이
동일한 조건에 놓이게 된다
밀 수확 실험. 피셔. '실험계획법'

정답을 모르면 실험해라
무조건 안하는 것은 잘못이다
미싱 판매


통계의 세가지 한계
. 현실 : 데이터가 적을 때 (우주실험 등)
. 윤리
. 감정 : 실험자와 피실험자 각각의 감정

참값
무한한 크기의 데이터를 얻으면 마땅히 알게 되는 진정으로 알고 싶은 값
# 빅데이터가 이를 가능하게 하고 있다 그리고 인공지능으로


회귀분석은
평균값에 수렴하는 것을 보여준다.
2차원 그래프로 보면 쉽게 보임
# 평균값의 불규칙성이 t분포를 따른다는데
# 그럼 규칙이 있는 것 아냐?


에비던스(근거) 찾기
구글 스콜라로 번역하여 검색하면 대부분의 근거(논문 등)을 찾아 볼 수 있음
대부분의 전문적 지식은 도표, 수실, 그래프로 되어 있음


스포츠 등 성공하는 사람은
개별적 성공이나 실패에 연연하지 않고
최선의 도전을 계속하기 때문에
그들은 위대한 기록을 수립한다
# 즉 통계적으로도 반복 훈련은 기술의 평균치를 끌어 올려놓는 것이다

이것이 성공으로 이어지는 것 뿐!





'○ 공존 > 경영' 카테고리의 다른 글

토론의 목적은 이기는 것 보다  (0) 2015.03.16
내 책임이다 - 리더  (0) 2015.02.17
100만원 경영학 (장사란 무엇인가?)  (0) 2015.01.16
정보조사의 기술  (0) 2015.01.02
린 스타트업  (0) 2014.12.08

+ Recent posts