지난주에 전 직장 동료분들, 주위 친구들, 가족들, 연구실 선후배들 등
많은 지인 분들과 미투데이 분들의 도움을 받아
석사논문에 필요한 블로그 웹장르 이용자 설문을 마쳤습니다.

9월 25일~ 29일까지 총 200분 정도가 설문에 응해주셨는데,
설문자 등록 후 끝까지 모든 항목에 유효한 답변을 해주신 분은
최종적으로 165명이셨습니다.

유효한 답변자 165명 중 94% 이상이 일주일에 1회 이상 블로그를 이용하는
활발한 블로그 소비자분들이셨고,
그 중 76% 정도의 분들이 본인의 블로그를 가지고 계셨습니다.

이런 액티브한 블로그 소비자분들께서
20개의 블로그 포스트를 장르 기준으로 분류해주신 결과~

연구자가 초기에 세팅한 분류와는 다음과 같은 일치율을 보였습니다.

연구자 부여 장르 1st 일치율 2nd 일치장르 2nd 일치율
신변잡기 88.2% 의견주장 2.5%
여행기/방문기 82.2% 신변잡기 6.4%
방법/노하우 68.6% 신변잡기 12.6%
뉴스기사 67.5% 소식/트렌드 16.0%
소설/대본 64.4% 신변잡기 11.9%
사진/그림/동영상 작품 63.2% 신변잡기 27.1%
시/노래가사 62.0% 멀티미디어 모음 15.3%
의견주장 55.6% 뉴스기사 11.1%
사고팔기 48.1% 이벤트/공지/안내문 25.3%
이벤트/공지/안내문 43.3% 소식/트렌드 24.8%
멀티미디어 모음 42.7% 사진/그림/동영상 작품 36.9%
리포트/논문/보고서 42.0% 사진/그림/동영상 작품 13.3%
강의/교육/학습자료 33.8% 설명문 16.2%
인물프로필/상품정보 33.6% 사고팔기 14.1%
리뷰/사용기 30.4% 리포트/논문/보고서 11.0%
설명문 23.8% 강의/교육/학습자료 30.6%
리스트 15.3% 신변잡기 46.9%
소식/트렌드 13.9% 뉴스기사 38.6%
자료실 0.0% 방법/노하우 34.4%

연구자가 '신변잡기', '여행기/방문기'로 분류한 포스트를  
실제 이용자 설문에서도 같은 장르로 분류하는 비율이 가장 높았으며,

'사진/그림/동영상 작품'과 '멀티미디어 모음'의 경우
약간 혼선이 있었던 것 같습니다.
원래 연구의도는 여기저기서 퍼온 사진/동영상 등은 '멀티미디어 모음'으로,
실제 자기 작품으로 자작한 것은 '사진/그림/동영상 작품'으로 분류하려고 했으나
실제로 퍼온것인지 자작한 것인지는 형식에 있어서 그 구분이 크게 의미가 없는 듯 하네요.

또한 '설명문'과 '강의/교육/학습자료'의 경우도 구분이 모호했는데,
대부분에 설명문(즉, 백과사전적 글)의 경우는 교육/학습 자료로 이용되는 탓에 그런 것 같습니다. 그래서~ 합치려구요 ^^

'소식/트렌드'의 경우도 일반적인 뉴스기사 형식을 갖추지는 않았지만,
다양한 소스를 통해 최근 트렌드나 행사소식 등을 전하는 경우
별도로 소식/트렌드로 분류하려 했으나,
실제로 정식으로 퍼블리싱 되는 뉴스기사의 경우도 트렌드 리포트 형식의 글이 많아
'뉴스/트렌드'로 합칠까 합니다.

'자료실'의 경우는 실제 연구자가 분류할 때도 명확하지 않은 부분이 있었는데,
역시나 설문조사에서 단 한분도 -.- 일치하는 분이 없어 없앨 예정이구요.

'리스트'의 경우는 쭈욱~ 링크 모음의 경우는 리스트로 인식하나,
100문 100답 식의 컨텐츠는 대부분 그냥 본인에 대한 신변잡기적인 글로 인식하시는 듯 했습니다.

이번 설문조사에서 가장 애매한 부분이 '리뷰/사용기'였는데요.
사실 블로그에 많은 정보성 글이 '리뷰/사용기'인데 (가령, 책리뷰, 영화리뷰)
제가 너무 헷갈리는 예시를 설문조사에 건게 아닐까 살짝 후회를 했습니다.

예상보다 낮는 연구자-답변자 일치율을 보여서요. =.=
포스트에 다양한 리뷰 형식의 글이 있다는 것을 반영하기도 하는 현상이라 생각됩니다.

여러분께서 참여해주신 설문조사 결과를 바탕으로
블로그 웹장르 기준을 정비해서
본격적인 장르 자동분류 실험에 들어가도록 할 예정입니다.

참여해주신 모든 분들께 다시 한번 감사합니다! ^-^

Posted by 시루

연세대 문헌정보학과 대학원 석사과정 사람들과
지난 방학 동안 조를 나누어 문헌정보학 세부 분야의 최근 연구 트렌드를 리뷰하였다.

리뷰 대상은 주요 학술지와 학술대회 발표 논문들.
정보검색(검색엔진) 분야의 경우
IPM, JASIST, 정보관리학회와 같은 주요 학술지에 검색 관련해서 발표된 논문들과
WWW2008, SIGIR 2008과 같은 주요 컨퍼런스에서 검색 관련해서 발표된 논문들을 합쳐
총 103개 논문의 초록을 위주로 최근 연구 동향을 정리해보았다.

< 주요 연구 Trend >

* 질의 관련 Trend
  질의 확장(9), 질의 분석(5), 질의 수정(3)
  (주요 주제)
   - 긴 질의
   - 자연 언어 질의
  (새로 떠오른 주요 기법)
   - Language Modeling
   - XML, HTML
   - Social Network
   - Eye-tracking

* 랭킹 관련 Trend
 - 학습에 의한 랭킹 (9)
 - 새로운 문서/용어 가중치 기반 랭킹 (4)
 - 매출과 정확도 최적화 랭킹 (2)

* 적합성 평가 Trend
 - 이용자 연구를 통한 적합성 평가(4)
 - 새로운 적합성 피드백 기법 개발(3)
 - 적합성 평가와 검색 성능의 관계(5)

* 멀티미디어 검색 Trend
 - 다양한 멀티미디어 개체들의 검색에 대한 필요성과 요구의 증가
 - 각종 검색 엔진들의 멀티미디어 검색은 여전히 제한적이며 한계점을 가짐
    대부분 텍스트 기반의 멀티미디어 검색
    텍스트 검색보다 좋지 않은 성능

발표자료




리뷰 논문 리스트



Posted by 시루
정보이용자연구 종합시험 준비를 하면서 정리한 연구방법론 종류별 짧은 특징 요약본.
결국 시험은 다양한 연구 방법론 사례들에서 안나오고,
'연역적' vs. '귀납적' 접근 방식에 대해서 나오기는 했지만.
나름대로 정리할 수 있었던 시간.

The Research Process
Methods: Examples by Type
- 사례 연구 (Case Study)
- 실험실 실험 (Laboratory Experiments)
- 현장 실험 (Field Experiments)
- 우편 설문 (Postal Surveys)
- 이메일 & 웹 설문 (E-mail and Web Surveys)
- 간단 인터뷰 (Brief Interviews)
- 심층 인터뷰 (Intensive Interviews)
- 집중그룹 인터뷰 (Focus Group Interviews)
- 네트워크 분석 (Network Analysis)
- 담화 분석 (Discourse Analysis) : 레퍼토리 & 실습
- 일지적기 & 경험 샘플링 (Diaries and Experience Sampling)
- 비간섭적 접근 : 역사 분석
- 비간섭적 접근 : 내용 분석
- 다중 데이터 소스 이용
- 메타 분석



참고도서 : Donald O. Case(2007), Looking for Information - A Survey of Research on Information Seeking, Needs, and Behavior. 2nd edition p.173 - 233
Posted by 시루
정보조직학 종합시험 문제로 나왔던 FRBR 관련 내용을
시험 공부하면서 정리한 내용이다.

목록관련 발표 때에도 봤던 내용인데,
자세히 정리하려니 시간이 걸리더군.



참고 도서 : 김태수 (2008), 목록의 이해 p.9-10, p.114-130
Posted by 시루

'특수분류법'이라는 정보 조직 수업에서 protege (http://protege.stanford.edu/)라는
온톨로지 구축툴을 이용해서 디지털카메라 온톨로지를 구축해보았다.
기존의 디지털기기 쇼핑몰에서의 온톨로지보다는
'구매자 친화적'인 온톨로지를 구축하고자 노력했다.
디카에 대해서 아는게 별로 없어서 고생을 많이 했지만,
이번 연구를 통해서 '온톨로지'라는 게 어떤 건지 어렴풋이 감을 갖게 되어 나름 뿌듯.


구매자 친화적인 상품 온톨로지 구축에 관한 실험적 연구

< 목차 >

1. 서론
1.1 연구 배경 및 목적
1.2 연구 내용 및 방법

2. 이론적 배경
2.1  온톨로지 개념과 구축툴
2.2  상품 분야의 온톨로지
2.3  이용자 중심의 온톨로지 구축 방법론

3. 상품 온톨로지 구축
3.1  상품 분야 결정 및 구매자 니즈 추출
3.2  기존 디지털카메라 온톨로지
3.3  용어 수집 및 속성 추출
3.4  클래스와 클래스의 속성 정의
3.5  클래스, 속성, 사례 간의 관계
3.6  온톨로지를 이용한 상품 검색

4. 결론 및 제언

[참고 문헌]
 




Update : Protege를 이용해서 온톨로지 구축하는 방법에 대한 문의가 있어서
             참고자료 링크를 함께 올립니다.

ontology development 101 - Protege 홈페이지 내 초급자 자료
http://protege.stanford.edu/publications/ontology_development/ontology101.html

[번역본] 온톨로지 개발을 위한 일반 지침
http://webzine.nl.go.kr/publish/krili/200804_02/pdf/policy01_0430.pdf

Posted by 시루

이번학기 '정보이용자연구'라는 수업에서 기말 페이퍼로 작성 한 연구계획서이다.
석사 논문을 다음과 같은 연구계획서에 따라 실제로 써볼까 심각하게 고민 중.

< 제목 >

Everyday Life Information Seeking 환경에서의
Work Task Analysis 방법론 적용에 관한 연구


< 초록 >
   
    본 연구는 일상생활에서 정보 추구가 필요한 문제 상황(Problematic Situation)에 대한 분석을 보다 심층적으로 하기 위해 주로 업무 환경에서의 정보 행태 연구 시 사용되어온 작업 과업(Work Task) 분석 방법론을 이용했다. 문제 상황을 하나의 작업 과업으로 보고, 과업의 복잡성, 특별성, 자발성, 긴급성, 과업 수행자의 기존 과업 경험여부 등과 같은 과업 성격에 따라 그 과업을 수행하기 위해 필요한 정보원의 차이가 있는지 살펴보려고 한다. 또한 일상생활의 정보 활동과 밀접하게 관련이 있는 웹 자원의 경우 과업 별로 추구하는 정보 형식을 자세히 알아보려고 한다. 이를 위해서 일상생활의 삶의 패턴이 다양한 10명의 연구 대상자들의 정보 추구 행태와 관련된 과업 일지, 인터넷 정보원 이용 행태와 관련된 동영상, 인터뷰 데이터 등을 분석한다. 이 연구를 통해서 특히 인터넷 기반의 정보 제공 & 검색 서비스들이 이용자의 일상생활에서의 정보 추구 맥락을 더 잘 이해하고, 이용자 상황에 맞는 정보원 및 서비스를 제공하기 위한 아이디어를 얻을 수 있길 바란다.

< 목차  >
 
1. 연구 배경 및 목적

2. 이론적 배경
2.1  일상생활에서의 정보 추구 상황
2.2  작업 과업 분석 (Work Task Analysis) 방법론

3. 연구 문제

4. 연구 방법 및 범위
4.1 연구 대상자
4.2 정보 탐색 행태 데이터 수집 방법
4.3 데이터 분석 방법

5. 연구 일정

참고 문헌
부록

Posted by 시루

이번 학기에 수강한 '텍스트마이닝' 수업에서 배운 내용을
시험 공부하면서 정리해보았었다.

주로 정영미 교수님의 '정보검색연구' 4장, 5장, 6장 내용 + 각종 프린트물 종합 정리!

< 목차 >

- 텍스트마이닝 전처리 – 정보추출
- 유사도 척도와 자질 선정
- 문헌 클러스터링
- 텍스트 범주화
- 자동요약



update : SVM 분류기 관련 내용 조금 수정됨

Posted by 시루
다음주면 중간고사...
이제 이번 학기도 중반을 접어들고 있다.
 
느즈막히 공부를 다시 시작하는 터라
빨리 학위를 받기 위해
이번 학기에 무려 네 과목이나 수강한다는 말씀.
이제 수업 학기는 이번 학기가 마지막이다.

* 이번 학기 수강 과목들
- 정보이용자 연구
- 텍스트마이닝
- 말뭉치 분석프로그래밍
- 특수분류법

정보이용자연구는 이미 회사에서 세미나를 진행했던
예습 과목이라 기대를 많이했었고, 기대한 만큼 실제로 넘 재미있다.
(70여 가지의 정보이용자 관련 이론들을 섭렵~ 룰루~ )

텍스트마이닝에서는 클러스터랑, 자동 범주화를 배우는데
파이썬을 배우는 말뭉치분석프로그래밍(언어정보학과 개설 과목)과
시너지를 내면서 그동안 궁금했던 마이닝 관련 지식들을 습득하고
직접 실습도 해볼 수 있을 것 같다.

그리고 잘 만 된다면 지금 배우는 기법들을
석사 논문에도 써먹을 수 있을 것 같다.

특수분류법은 '정보 조직'과 관련된 전반적인 내용과 함께
요즘 유행하는(?) 온톨로지, 시맨틱웹 등에서도 배우게 되어 유용!

회사도 그만두고 공부에 몰입하다보니
요즘 한창 즐공, 열공모드.

이번 학기에 듣는 것들을 모두 참고하여
석사 논문 주제를 정하고 연구 계획서까지는 작성할 수 있어야 할텐데
조금 부지런을 떨어야 할 듯.

내 인생에서 또 언제나 이런 공부 여유를 부려보나 싶어서
시간 시간이 소중하고 그렇다.
Posted by 시루

연세대 문헌정보학과 학부 수업 중
'정보조사제공론'이란 수업에서 특강을 하다.

검색서비스 기획자가 하는 일과 비젼,
검색서비스 기획자가 되기 위해서 준비해야 할 것들에 대해

지난 6여년 동안 내가 검색서비스 기획자 (혹은 검색기획자)로서 일하면서
겪은 경험들을 바탕으로 간략하게 정리해서 발표했다.

작년에도 같은 교수님의 같은 수업에서
비슷한 내용 가지고 특강을 했었는데,
오늘은 조금 반응이 덜 하기는 했지만...
(생각보다 '검색기획자'라는 직군에 대해 생소해들 하는;; )

내 블로그에 들르는 분들 중,
검색기획에 관심있어 하시던 분들과 공유하고자 올린다.

Posted by 시루

지난 학기 '계량정보학'이라는 학문을 처음 접하면서
문헌정보학 세부 연구 분야들의 지식 구조를 리뷰해야겠다는 생각이 들었었는데,

학기말 논고를 쓰면서 전체적으로는 아니더라도
문헌정보학 연구자들의 연구 동향을 '대학별'로 측정하는 시도를 함으로써
이 분야에 대한 최근 연구 동향에 대해 감을 잡게 되었다.

원래 미국 문헌정보학 대학원 상위권 대학 10개를 대상으로 연구를 진행하려고 했는데,
여러가지 시간과 리소스 제약으로 3개 대학만 분석을 하게 된 것에 아쉬움이 남는다.
(교수님께서 더 해보라는 은근한 압박이;; )

이번 논고의 개인적인 의미라고 하면,
스캐닝 형태이기는 했지만 최근 5년간의 미국 문헌정보학계의
우수 대학 연구자들의 많은 논문들을 스캐닝했다는 사실,
CFA (Correspondence Factor Analysis) 기법을 직접 활용해봤다는 경험을 꼽을 수 있다.

문헌정보학 대학원의 세부 연구 동향 및 평가
- 미국 LIS 상위권 대학원을 중심으로


< 목차 >

I. 서론
 1. 연구 배경 및 목적
 2. 연구 범위 및 방법

II. 이론적 배경
 1. 문헌정보학 연구 주체에 대한 계량정보학적 평가
 2. 문헌정보학 연구 주제 영역 분류
 3. 대응분석(CFA)에 의한 연구 분야 분석

III. 연구 방법론
 1. 분석 대상 데이터 및 수집 방법
 2. 분석 방법

IV. 연구결과
 1. 연구 논문 수 기준 영역별 분석결과
 2. 연구자수 및 연구자 인용지수 기준 분석결과

IV. 결론 및 제언
참고 문헌



Posted by 시루

BLOG main image
검색하며, 사랑하며, 성장하는 당신 그리고 나 by 시루    About Me

카테고리

분류 전체보기 (1256)
공부 (32)
검색 (81)
(10)
블로그 (4)
기획 (5)
일상 (18)
신앙 (10)
독서 (4)
문화 (4)
여행_나들이 (29)
Links (516)
미투데이 (410)
결혼 (3)


Statistics Graph
Total : 415,104
Today : 3 Yesterday : 14