구글의 조직, 비젼, 전체 서비스 구조 등에 대해
블로그나 뉴스 등을 통해서 정말 많이 접해왔다고 생각했는데,
직접 사장급 관련자에게 강의를 들으니 그동안 조각조각 들었던 것들이 전체적으로 정리가 되었다. 즉. 구글의 전체 기술과 문화 Overview하는 기회로는 좋았다.
단, 강의 내용 중 일명 '기존 포털'과 '구글'을 비교하는 장표가 있었는데
Search, Gate로서의 철학을 강조하기는 하나 구글의 포털형 서비스 라인업을 보면
꼭 그렇지도 않은데 너무 강조하시더라.
물론 서비스의 '메인화면'은 중요하다.
적어도 메인 화면에 이것저것 걸어놓지는 않으니까.
그래도 내가 보기에 구글은 포털이다. (겉으로 보기에 느슨하게 연결되어있어서 그렇지)
그리고... 2Q에도 서비스 오픈할꺼고,
아마도 3Q, 4Q에 봇물처럼 나올꺼란다.
몹시~ 기대된다. 쫌 글로벌 구글다운 색다른 구글코리아 작품들이 나오길.
발표 후 시간이 없어서 급히 나가시던 조원규 사장님께 물어봤던 질문.
Q. 모든 것이 자동화, 머신러닝 사용한다고 하는데,
검색품질 관리하는 인력있고 테스트 인터페이스 본적 있음
검색품질 관리하는 인력 규모는 어느 정도?
그 인력들에 대해 사내 어떤 관점을 가지고 있나?
A. EVAL을 하는 인력은 있다.
그러나 EVAL은 EVAL일뿐. 실제 서비스 굴러가는 거는 자동화다. 사람손 안탄다
(계속 강조하심. 정말 구글 사라들은 집착증이 있는 것 같다. 자동화에 대해서)
인력 규모는... 꽤 된다고는 하는데 자세히는 밝히시기 어려우신 듯.
아- 그리고 구글코리아 성인인증 붙이고, 수동 운영 인력 전혀 없단다. (이것도 강조 -.-)
Q. 구글식 통합검색 EyeTracking 실험 결과? 자체적인 평가는? (못 물어봤음)
--- 주요 내용 요약 ---
* 구글 Overview
구글 Mission :
Organize the world's information and
make it universally accessible and useful
Finding
Ranking
Reliability
Freshness
Speed
...
수치들
미국 이외의 검색 중 50%
전세계 검색 중 61.8%
지원 언어 112개
국제 도메인 157
* Innovations @ Google
1) Storing the Web
20+ billion web pages x 20KB = 400 terabyte
GFS (Google File System) : Distributed, Scalable, Reliable, Efficient
2) Organizing the data
BigTable : (구글 파일시스템 위에 올라가있기 때문에) Distributed, Scalable, Reliable, Efficient
3) Processing the data
실시간 쿼리 처리 능력필요 10K's per second
Cheap Linux boxes
Sohpisticated Server management System
MapRedue : 병렬 처리
4) Utilizing the data : Machine Learning
- Spelling correction
- Spam filtering
- Machine Translation
- Onebox triggering : 어떤 쿼리에 Onebox를 노출해야 하는지
- Accessory detection in Product Search
- Content Ad targeting
- Machine failure detection
검색철학
Portal vs. Search
- Goal : 구글, 어떻게 하면 원하는 정보로 빨리 보내줄 것인가
- Content Ownership : Facilitate creation of open contents, Outlink to contents
- Apps vs. Platform : Build Platforms, 안드로이드, 오픈소셜
- Search & Ads : 편집하지 않는다, 중립성, 수작업 병적으로 싫어함
Don't be Evil (검색결과를 편집하지 않고, 광고를 무조건 돈만 준다고 위에 올리지 않는다)
Search Metrics
Comprehensiveness : 검색커버리지
Relevance : 정확성 (Top10안에 원하는, 되도록이면 Top7 안에)
Speed : 0.5초 안에 결과 나와야 한다
User Experience : 사용자 편의성
구글 유니버설 검색 : 블랜딩, Top10 안에 원하는게 나와야 해서 섹션별 검색 안함
Innovation : from unique culture
- 조직구조가 수평적(flat)
- 작은 팀조직 (한 팀 5-6명 정도)
- 70 : 20 : 10 = 주요사업(검색, 광고) : 주변 서비스 (Gmail, Apps 등) : 본 사업과 상관없는 사업 (하드웨어, 주파수 경매 참석)
- 20% 프로젝트 (80% 시간은 현재 업무, 20% 시간은 자기가 원하는 것)
- 사내에서 모든 정보 오픈
- 잦은 실험과 실패 허용
* 구글코리아
20여개국 50여개 지사 설립 중 R&D센터 갖춘 지사 : 구글코리아
최근 가장 큰 런칭 : 유튜브, 한국식 유니버설 검색
왜 현재까지 9개 제품밖에 런칭 못했냐.
-> 초기 코딩하는데까지 시간 걸림. 기반 인프라
2008 Q3, Q4에는 정말 많은 서비스가 나올 듯.
2Q에서도 많은 런칭 기대