Issuu on Google+

平成 20 年度卒業研究報告書

題目 SNS におけるユーザーの書き込み行動 に関する研究

 ー mixi のトピックとコメント発生の特性ー

京都工芸繊維大学繊維学部デザイン経営工学科 学籍番号 05340201 氏名 古川幹洋 平成 21 年 2 月 6 日 提出

指導教員 川北 眞史 教授


研究題目 SNS におけるユーザーの書き込み行動に関する実態調査 平成 20 年度 学籍番号 05340201 氏名 古川幹洋

概要 近年注目されている Web サービスとして、SNS が挙げられる。SNS とは、Social Networking

Service の略語であり、インターネット上でコミュニケーションを行う Web サービスの一つであ る。SNS は、登場から急速にユーザー数を増やしてきた。国内では代表として mixi や GREE が 挙げられる。

SNS の特徴は大きく 2 つあり、一つは、友人同士が承認することで築かれる友人関係の登録機 能、もう一つは、日記や掲示板に関する総合的なコミュニケーション環境である。この二つの特徴 に対して様々な研究がなされている。 本研究は、SNS の国内最大手である mixi を対象に mixi 内の掲示板であるトピックのコメント についての研究である。つまり、SNS の総合的なコミュニケーション環境であることに着眼した 研究である。今回、mixi に現存するトピックの内、約 3 万件を抽出して分析した。コメントの動 向を具体的に知ることができれば、その背景であるユーザーの行動を知ることができ、SNS 運用 上の役に立つと考えられる。SNS は、まだ歴史も浅く、十分な研究がなされていない。そのため、

SNS を運用していく場合、経験や勘に頼らざるをえない部分があり今回の研究が役に立つことが 期待される。 研究の結果、コメントの発生には、ユーザーの生活上の特性が現れていると考えられ、書き込み しやすい時間帯や閲覧しやすい時間帯などがあることが推測できる結果を得た。また、SNS の凝 縮性とそれによるコミュニケーションの傾向を図る指標について考察した。


目次 1

はじめに

2

2

SNS について

3

2.1

SNS とは . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3

2.2

SNS の歴史 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4

2.3

SNS の現状 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4

研究の背景

5

3.1

マイミクの登録を使った研究 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

3.2

コミュニケーションの研究

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

3.3

本研究の位置づけ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8

3.4

mixi のユーザー数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8

調査

9

3

4

データの収集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

結果と分析

11

5.1

成長中のトピックの除外 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

5.2

年毎の基本的な分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

詳細な分析

17

6.1

べき乗則について . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

6.2

次のコメントがつくまでの日数 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

6.3

次のコメントがつくまでの日数の推移 . . . . . . . . . . . . . . . . . . . . . . . . .

20

6.4

コメント数別のトピック度数分布 . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

7

結論

28

8

成果の活用と今後の課題

28

9

謝辞

28

付録 A

詳細資料

30

mixi のトピックの収集手順の詳細 . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

4.1 5

6

A.1

1


1 はじめに 近年、SNS という Web サービスが注目を浴びている。SNS とは、Social Networking Service の略語であり、インターネット上でコミュニケーションを行う Web サービスの一つである。主な

SNS として、国内では mixi や GREE、海外では Myspace や Facebook がある。国内最大手の SNS である mixi は、2004 年誕生以降、順調に利用者数を増やし、2008 年 7 月時点では約 1500 万 人のユーザーがいる。

SNS の主な機能として、日記機能とコミュニティ機能がある。日記機能では、ユーザーが日記 を書いたり、他のユーザーの日記にコメントをしたりすることができる。また、これらの日記やコ メントは、他の人も見ることができるので、知人同士で日常のちょっとした出来事や近況を伝えた りするのに利用されている。一方、コミュニティ機能では、作ったコミュニティに趣味や関心ご と、考えの合うユーザーが集まり、掲示板を使って雑談や討論を行うことができる。これらの機能 自体は Web サービスとしては新しいものではないが、SNS はユーザー同士の知人の情報をまと め、知人同士のコミュニケーションを促進する機能を持っているのが特徴である。 本研究は、国内最大手 SNS である mixi を対象に、そのコミュニティでのユーザーのコメント の実態について研究する。SNS のコミュニティ中には、コメントが書かれた時間、誰が書き込んだ かすべて記録してある。これらのデータを取り出すことで、ユーザーがコメントを書く際の特性を 明らかにし、コミュニケーションの促進や SNS 運用上での注目すべき特徴について考察する。

2


2 SNS について 2.1 SNS とは SNS とは、Social Networking Service の略語であり、インターネット上でコミュニケーション を行う Web サービスの一つである。SNS は、特別な知識がなくてもインターネット上で日記や自 分のプロフィールの公開ができ、その上で知人同士のコミュニケーションを促進する機能を持っ ている。SNS の定義には諸説あり定まっていない。本研究では、SNS の特徴として「 日記・コミュ ニティ機能」、 「 相手の承認を得た上での知人の登録ができる機能」、「 コミュニケーションにハンドル ネームを用いる機能」の 3 つを挙げる。本研究で扱う SNS とは、この3つを実装している Web サービスである。以下、3 つの機能について説明する。 まず最初に、1 つ目の「 日記・コミュニティ機能」について述べる。日記機能は、ブログなどと 同様に日記を書くことができる機能であり、コミュニティ機能は、コミュニティを作ることができ る機能である。 コミュニティは、トップページとトピックによってできている。コミュニティを使うことによっ てユーザーは共通の話題によるコミュニケーションがとりやすくなる。SNS では、コミュニティ の中にある掲示板のことをトピックと呼ぶ。コミュニティにアクセスすると、まずトップページが 表示され、そこからトピックにアクセスできる。トップページには、コミュニティの方針、例えば トピックで何についてコメントをするのかや、コメントをする上での注意点などが書かれている。 自分の方針に沿ったコミュニティを作ることもできるし、他のユーザーが作ったコミュニティに も、「 コミュニティに参加」のボタンを押して参加できる。参加すると、任意の話題でトピックを立 ててコメントを募ったり、すでに立っているトピックにコメントすることができる。また、自分の 持つトップページにトピックの更新が通知され、トピックに他のユーザーがコメントしているのを 見たり、自分がコメントした後、どうなっているかを見ることができる。 これらの機能自体は新し い機能ではない。しかし、次の項目である「 相手の承認を得た上での知人の登録ができる機能」に よって日記・コミュニティ機能は、既存の Web サービスとは異なる利用を生んでいる。 次に「 相手の承認を得た上での知人の登録ができる機能」について述べる。「 相手の承認を得た上 での知人の登録ができる機能」とは、登録したい相手に対してその旨のメッセージを送り、相手に 承認された場合、登録が成立する機能である。この登録が成立した知人の呼び名は SNS によって 様々だが、mixi では「 マイミク」 、GREE では、 「 友達」 、MySpace では、 「 フレンド」となっている。 現実上の知人や友達との混同を避けるため、最大手 SNS の mixi にならい、以下この知人のこと をマイミクと呼ぶ。マイミクになることによってお互いの日記の更新がトップページに通知され るようになる。既存の更新を通知する機能として RSS があるが、RSS は更新を見たいと思った人 が任意で登録できる。マイミクの登録では、まず相手の承認が必要であり、相手の日記の更新を受 け取るだけでなく、自分の日記の更新も相手に伝えることが RSS との違いである。SNS 以外のイ ンターネット上の日記には、ブログやホームページがあるが、これらは不特定多数へ向けて発信さ れ、コンテンツとしての意味合いが強い。一方、SNS では相手の承認を受けてお互いの更新を通知 しあうことで、日記をコンテンツではなく双方向性のあるコミュニケーションツールとして機能さ せている。*1 *1

ITmediaNews「 mixi 疲れを心理学から考える」http://www.itmedia.co.jp/news/articles/0607/21/news061.html

3


最後に「 コミュニケーションにハンドルネームを用いる機能」について述べる。ハンドルネーム とは、インターネット上で用いられるニックネームのことである。SNS は、コメントを書く際に固 有のハンドルネームが必ず用いられ、匿名性でない*2 。特定の相手とのコミュニケーションには、 必須の機能である。また、コミュニティ上でのコミュニケーションでも固有のハンドルネームが用 いられることから、コミュニティで知り合ったことをきっかけにマイミクになることも少なくな い。コミュニティでは、トピックを用いてコミュニケーションするが、誰がコメントしたのかが分 かるため、匿名性掲示板にくらべて持続的な関係をつくることができる。

2.2 SNS の歴史 世界初の SNS は、1996 年 1 月、企業家アンドルー・ワインライク (Andrew Weinreich) 氏が開始 した「 sixdegrees.com」だと言われている。名前である Sixdegrees は、 「 Six Degrees of Separations(6 次の隔たり)」に由来する。「 6 次の隔たり」とは、人は自分の知り合いを 6 人以上介すと世界中の 人々と間接的な知り合いになれる、という仮説であり、ワインライク氏は、インターネットを通じ てこういった知り合い関係の地図を作ろうとした。*3 現在の SNS と同様に、つながりのある人し か書き込めない掲示板やメールサービス機能を提供していた。以降、SNS 普及のきっかけとなっ た「 Friendster」や google の「 Orkit」などが生まれ、日本国内では 2004 年 2 月に GREE と mixi がサービスを開始した。当初は GREE の方が規模が大きかったが、同年 9 月に mixi が逆転した。 会員数は、2008 年 7 月で mixi が 1500 万人*4 を超え、同年 8 月 GREE は、600 万人*5 を突破した と報告されている。

2.3 SNS の現状 現在 SNS は、米欧、アジア各国で台頭しており、国や地域によって様々な SNS が発達してい る。総ユーザー数で比べると、MySpace を筆頭に Facebook、Orkit と続く。SNS が世界的に普 及するにあたっては、言語や文化の壁、インターネット普及率など地域によって大きく状況が異な り、例えば、日本国内において、2006 年 11 月から MySpace は日本語版を公開しているが、その ユーザー数は日本固有の SNS「 mixi」に及ばない。表 1、表 2 は、世界大手 SNS と国内 SNS のユ ニークビジター数である。ユニークビジターとは、その期間中利用したユーザー数で重複を除いた ものであり、おおむね実際に利用しているユーザー数として見ることができる。検索エンジンであ る Google や Yahoo の月間ユニークビジター数は、14000 万人前後であり*6 、実際に Facebook や

MySpace はそれらに匹敵する規模にまで成長している。本格的にサービスが認知され始めたのが、 2003 年 3 月の「 Friendster」開始からだとされているが、それから 5 年足らずで SNS は急速に世界 へ普及している。

*2 *3

*4 *5 *6

Unlinkablity を満たしていないの意 @IT 情報マネジメント用語辞典 ”http://www.atmarkit.co.jp/aig/04biz/sns.html” 株式会社ミクシィ 2008 年度第 1 四半期決算説明会 IR 資料 ”http://mixi.co.jp/ir/news.html” GREE 株式会社 沿革 ”http://gree.co.jp/corporate/history/” 2008 年 5 月 ITmedia ”http://www.itmedia.co.jp/news/articles/0805/16/news014.html”

4


SNS 名

ユニークビジター数 (万人)

Facebook

12390

MySpace

11469

Hi5

4960

Friendster

3810

Bebo

2510

表 1 2008 年 5 月:世界大手 SNS のユニークビ

SNS 名

ユニークビジター数 (万人)

mixi

1274

MySpace

125

Orkut

64

Facebook

54

GREE

46

表 2 2008 年 6 月:国内 SNS のユニークビジター数

ジター数 出典: comScore.Inc ”Worldwide Unique Visitors To

出典: コムスコア・ジャパン ”日本の SNS に関する 2008 年 6 月利用動向調査結果”

the Top Social Networks”

3 研究の背景 このように昨今、インターネットユーザーにとって注目されている SNS だが、SNS に関連した 先行研究分野は、大きく 2 つに分けられる。1 つは、SNS 固有の機能であるマイミクの登録を使っ た研究で、もう一つは、日記や掲示板に関するコミュニケーションの研究である。

3.1 マイミクの登録を使った研究 マイミクの登録を使った研究では、マイミクにより知り合い関係が可視化されるという特徴を 用いる。知り合い関係とは、端的にいえばお互いが知り合いであるかどうかということである。旧 来はアンケートやインタビューにより調査・研究が行われていたが、使える時間や資金も限られて いるため、行われる研究も特定の地域や組織に限定せざるを得なかった。SNS のマイミクの登録 を使えば、知り合い関係を定量データとして扱うことができる。SNS によって、数万人を越える規 模での知り合い関係の調査が可能になった。湯田ら [5] がマイミクとして知り合い関係が可視化さ れることを用いて、mixi 上のマイミクのネットワークの基本的な構造を明らかにしている。マイ ミクのネットワークの特性として、スケールフリー性や高い凝縮性が確認されている。 ��� 1 にスケールフリー性をもつネットワークの例を示す。右がスケールフリーのネットワーク で、左はランダムのネットワークである。点と点が線によって繋がっているが、ネットワークでは、 この点をノード、線をリンクと呼ぶ。全てのノードの間にリンクがあるわけではないので、ネット ワークの特性を見る場合、ノードとリンクの分布が重要になる。 図 1 の、1つのノードが持つリンクの数を横軸にとり、その度数をグラフにしたものが、図 2 で ある。スケールフリーは、barabasi ら [12] がインターネット上におけるページの地図を作成しよ うとしたときに発見された構造であり、その分布がべき乗則である。SNS を用いたネットワーク の研究では、ノードを人、リンクを知り合いとして用いる。図 2 の左のように、ランダムなネット ワークは正規分布に従うので、例えば、平均の知り合いの数を 5 人とすると、5 人が図 2 の右図の 頂点部分になる。そこからみれば、5 人前後の知り合いをもっている人がほとんどで、2∼3人し か知り合いのいない人や 10 人の知り合いをもつ人は極僅かである。一方、スケールフリーのネッ トワークでは分布がべき乗である。さきほどの例と同じく平均の知り合いの数が 5 人だとすれば、 図 2 の右で、中心であるが、平均値がどうであれ、1,2 人しか知り合いのいない人の方が圧倒的に

5


図 1 スケールフリーネットワークとランダムネットワーク 出典: barabasi [12] ” Diameter of the World-Wide Web”

図2

スケールフリーとランダムのネットワークの分布の違い

出典: barabasi [12] ” Diameter of the World-Wide Web”

多く、10 人の知り合いを持つ人は極僅かであるので、べき乗の分布では正規分布と違い平均値に大 きな意味がない。barabasi らは、インターネット上に存在するページとそのページが持つリンク をそれぞれノードとリンクとして研究を行った。旧来では、ネットワークの図 2 右のように正規分 布に従うものであると考えられていたが、barabasi らの研究の結果、スケールフリーのネットワー クであることがわかった。べき乗則に従う場合、少数の線を持つ大多数の点と、ハブと呼ばれる非 常に多くの線を持つごく少数の点が存在する。これとは対照的に、ランダムなネットワークでは、 度数分布が平均から大きく外れるほどノード数が少なくなり、平均値が系を特徴づける「 スケール (尺度)」となる。それと比較して系を特徴づける「 スケール(尺度)」がないのでスケールフリーと 呼ばれる。こういった背景の下、湯田ら [5] の研究によって mixi のマイミクのネットワークもラ ンダムネットワークではなく、スケールフリーのネットワークであることがわかった。更に mixi のネットワークでは、高い凝縮性が確認されている。凝縮性について、さきほどの図 1 の右図で説 明すると、赤、緑、黒の点で、ハブが赤、ハブに直接繋がっているのが緑、ハブに直接繋がってい ないのが黒である。この時、緑と緑、緑と黒との間にリンクが多い場合を凝縮性が高いと言う。図

1 の右図は、凝縮性が低い。この場合、緑の点から隣の緑の点に辿っていこうとすると、赤を一度 経由する必要がある場合が多い。凝縮性が高い状態では、隣の緑とも直接繋がっており、緑・赤・ 緑で三角形が多く形成される。mixi では、この二つの緑がリンクを持つ状態で赤を持つから、二 つの緑にとって赤は共通のマイミクといえる。凝縮性が高いということは、お互いに共通のマイミ クを多く持つ知り合い同士で固まりを作っているということである。 このスケールフリー性は、生態系の食物連鎖など自然界のネットワークにも多く見られ、その 成立過程や動向に対して盛んに研究されているが、観測されるスケールフリー性の背景について

6


は、まだよくわかっていない。mixi のネットワークについても、高い凝縮性やスケールフリー性 といった特徴があるが、果たしてそれが何を意味しているのか、ということはまだわかっていない 状況である。こういった SNS の現状に対し、本研究では、次節に述べるコミュニケーション活性 化の観点から mixi の実態について研究を行う。

3.2 コミュニケーションの研究 このように SNS 研究ではマイミクのネットワークを用いた研究が主だが、安田ら [6] は、マイミ クのネットワークを用いつつ、マイミクのネットワークとコミュニティの関係について研究してい る。その結果、ユーザーへの影響が強いコミュニティでは、インターネット上での交流とオフ会な どを通じた現実世界での交流が重要な役割を果たしていると論じていて、現実とネットを相互に用 いていくことが、コミュニティやそれを通じたコミュニケーションを活性化する方法であると述べ ている。 ユーザーのコミュニケーションの活性化という視点から研究を行ったものは、SNS 以前の掲示 板やブログの頃から存在している。先に SNS の先行研究分野は、主に2つに大別できる、と述べ た。1 つは、SNS 固有の機能であるマイミクの登録を使った研究で、もう1つは、日記や掲示板に 関する研究である。マイミクの登録を使った研究が、前述したマイミクのネットワークやコミュニ ティの研究であるのに対し、日記や掲示板に関する研究が、ユーザーのコミュニケーション活性化 に着眼した研究である。 コミュニケーションの活性化に影響を与えるものには直接的な影響を与えるものと間接的な影響 を与えるものがある。コミュニケーションの活性化に直接的な影響を与えるものとして、コミュニ ケーションの中身である言葉の意味やコンテンツとしての良さがある。Web 上の日記であるブロ グに関する研究として、山本ら [10] がブロガーに対するアンケート調査を用いて、ブログ上でのコ ミュニケーションはどのように形成されるかついて研究している。ユーザーのコミュニケーション の動機として自己表現・関係構築・情報提供といった要因から、文章や更新の行動へと繋がり、ト ラックバック、トラフィック、コメントといった反応を生むとしている。 また、江下 [8] は、Yahoo!掲示板に関して調査を行い、掲示板をコンテンツとしてみたとき、掲 示板においてどのようなユーザーによってコミュニケーションが形成されるかについて研究して いる。ユーザーの役割は状況によって変化していき、ある時は、リーダー的な人物がコミュニケー ションを引っ張る時期があれば、またある時は、少数のユーザーのみがコミュニケーションを行っ ている時期もあり、状況によってコミュニケーションの型とユーザーの役割は変化する、と結論し ている。 これらコミュニケーションに直接関与する研究は多いが、一方でコミュニケーションのもう1 つの要素である間接的な要因についての研究は少ない。間接的な影響を及ぼすものとして、Web ページのデザインや日常での生活スタイルなどがある。コミュニケーションに間接的な影響を及ぼ す要因についての研究として茂登山 [11] は、Web ページデザインの重要性について論じているが、 定量的に調査した研究は見あたらない。

7


3.3 本研究の位置づけ コミュニケーションの活性化は、SNS を運用する立場から考えた場合、特に重要である。SNS は 日記やコミュニティを用いたコミュニケーションの場をユーザーに提供しているが、一方で、SNS 事業主の収入は主にページに挿し込まれたバナーによる広告収入である。SNS 事業主は、ユーザー のコミュニケーションが活発になるような環境を整備し、ユーザーが心地良くコミュニケーショ ンできると SNS 上でのユーザーが過ごす時間が増え、ページビューが増える。ページビューが増 えるとバナーによる広告収入も増加する。そのため、SNS を運営する上ではユーザーのコミュニ ケーションを活性化することが必要である。 また、先に述べたように SNS のネットワークは複雑でその実態が把握できていない。これは、

SNS を運用していく場合、経験や勘に頼らざるをえない部分があることを示しており、SNS を安 定して運用していくには、より詳細な内部の実態に関する知見が必要である。 これらを踏まえ、本研究では、SNS の代表として mixi に注目し、そのコミュニケーションの 実態について調査する。mixi のトピックに記録されたコメントに関する諸情報からコミュニケー ションの間接的な要因を把握し、その背景について考察する。また、コメントの発生を予測する方 法について検討する。

3.4 mixi のユーザー数 ここで調査対象となる mixi のユーザー数について述べておきたい。 図 3 は、株式会社ミクシィ の IR 情報による毎年 6 月 30 日時点でのユーザー数である。2004 年 2 月からサービスを開始した

mixi は、2008 年 6 月 30 日でユーザー数 1490 万人に達している。ユーザー数の伸びは年々鈍化し ているが、2008 年の前年比でも 140% と、まだ成長している。このユーザー数の推移を踏まえ、ト ピックのコメントの調査結果について分析していく。

8






 



   





 "#$%#& ')(+*-,-.



 





 

/  



 

 

    



 



 

   

   

 ! "#$#&

図3

0 214365!

年別 mixi ユーザー数の推移

4 調査 今回、個人の閲覧できる範囲でトピックの調査を行った。そのため、トピック内の調査として は限定的である。mixi のトピックでは、全てのユーザーに公開するか、同じコミュニティに所属 する者だけに公開するか、といった設定ができる。全てのユーザーに公開している場合を「 公開」、 同じコミュニティに所属する者だけに公開している場合を「 非公開」と呼ぶが、今回行ったトピッ クの詳細な調査は、 「 公開」設定だったものだけである。 コミュニティでは

• コミュニティにトピックを立てる • 立てられたトピックにコメントを書き込む の 2 つがユーザーの主な活動である。この 2 つに対して、mixi から得られるデータは次の 3 点で ある。

1. 活動が行われた時間 2. 活動を行ったユーザーのハンドルネーム 3. 活動の内容 本研究では、この3つのデータを収集した上で、主に、1. 活動を行った時間 を用いて詳細な分 析を行った。

9


4.1 データの収集 本研究では、まずランダムに mixi のトピックを収集するクローラを作成した。クローラとは、 自動的にページを保存するプログラムのことである。クローラの詳細については、巻末の付録

A.1.1 に記載する。 mixi のトピックには、それぞれ ID が割り当てられている。そこで、乱数によって ID を発生さ せることで収集するページを選んだ。2008 年 12 月 7 日から 2 日間に渡りページを収集した。その 結果、56,985 件のページを収集し、重複はなかった。そのうち、既に削除されたページが 22,204 件あり、有効なページ数は、34,781 件であった。また、有効なページのうち、トピックの設定に より公開されていたトピックは 22,793 件、非公開だったトピックは 11,988 件であった。公開・非 公開ページの分類法と詳細なデータの収集方法については、巻末の付録 A.1.2、A.1.3 に記載する。 収集されたデータが母集団に対して適切かどうか、株式会社ミクシィの PressRelease より発表さ れたトピック総数を用いて、収集したトピック数の適合度検定を行った。表 3 は、発表されたト ピック総数と対応する収集したトピックの数である。適合度検定の結果、χ2 値は、101.33 で、有 意水準1%に対して p 値 < 0.001 であった。よって今回収集したデータは、母集団の分布と時系 列でみて一致している。従って、今回抽出したトピックは、標本として適切である。

トピック総数

収集したトピック数

2004/11/25

420,421 件

151 件

2005/12/16

3,278,000 件

2,647 件

2006/3/1

4,937,000 件

3,645 件

表3

トピックの総数と収集したトピック数

10


5 結果と分析 5.1 成長中のトピックの除外 トピックには、コメントがつき終わったものと、まだコメントがついている途中のものがある。 コメントがついている途中のものは、トピックの変化について考える場合は重要だが、全体的な傾 向を見る場合誤差の原因となる恐れがある。図 4 は、全てのトピック内での次のコメントがつく までの日数の度数と累積パーセントである。1 日と経たないうちに、68% のコメントがつき、1 日 後には、82% のコメントがつく。逆にいえば、1 日後にコメントがつかなければそれ以降コメン トがつく確率は、100-82=18% となる。ここで、累積 % が 95 を越える 14 日後をコメントがつき 終わった点と仮定した。全てのトピックの内、最後にコメントされた日から 14 日経っていないト ピックをコメントがついている途中であるとみなし、その結果、831 件をコメントがついている途 中と判定し、分析対象から除外した。  

   



  

  

   



  

    

 

 

    

 



 !

図4

"$#$%'&)(+*,.-0/21!3

次のコメントがつくまでの日数

11


5.2 年毎の基本的な分析 5.2.1 トピック数・コメント数・ユーザー数の傾向 図 5、図 6 は、それぞれ収集されたトピックとそれに含まれたコメントの年別の推移である。収 集したトピック総数は、21,962 件、コメント総数は、442,786 件であった。収集日が 2008 年 12 月

7 日であり、2008 年だけ観測日数が少ないため、残りの 24 日が単純に比例するとして、1 年 365 日に対する 24 日の割合は

24 365

= 0.066 なので

1 1−0.066

= 1.0704 を 2008 年の度数にかけて予測値

とした。前年比を見ると、コメント数、トピック数共に mixi のユーザー数と同様に年々その成長 は鈍化している。また、度数を見ると、コメント数は、2008 年でも増加しているが、トピ���ク数 は減少に転じている。このことからユーザーの書き込みの性質が変化していることが考えられる。  

    

  



!#" $&%'(

  

 

 

   

 

  

    

 

  

 

 

  

     

            

 !#"%$

  





  

  



    

  



  



)  





+ 

 

  



 



!#"%$ &(')*



 *"

, .-/10323

図 5 年別コメント数の推移

図6

12

+ -,/.10

年別トピック数の推移


図 7 は、ユーザー数とトピック数及び、コメント数の関係をグラフにしたものである。これら は母集団に対する予想値である。予想の詳細は、巻末の付録 A.1.4 に記載する。この図を見ると、 ユーザーあたりのトピック数、コメント数ともに減少しており、年々積極的に活動するユーザーが 少なくなっていることがわかる。一方で、トピックあたりのコメント数は増加していて、トピッ ク自体はコメントが多いという意味で、盛り上がりやすくなっている。これらの結果から、年々、 ユーザー数の増加に伴い、SNS を利用しているユーザー層やトピックの利用され方が変化してい ることが考えられる。この変化の背景として、6.3 に詳述するが、知り合いとのコミュニケーショ ンに特化した SNS 独自の要素があるのではないかと推測される。



   

  

  



   

 



 

  

 





  

  



 

 

 !"#%$'&)(+*,-/.10+243!576+8 .)9;:=<>#%$'&)(+*,-/.10?A@CBDE2F6;5G6+8 !"#%$'&)(H.)9I:J<K0+243!576 図7

総ユーザー数・トピック数・コメント数の関係

5.2.2 月別・日別の傾向 図 8、図 9 に年毎の月別・日別の推移を示す。どちらの場合でも、2008 年については予測値で ある (予測の詳細は巻末の付録 A.1.5)。 図 8 は、年毎・月別のコメント数の推移だが、04,05 年 は、コメント数が月毎に増えている。06 年は、全体としてコメント数は増える傾向にあるが、月 ごとの変化が現れるようになる。その後、07,08 年では、増加傾向は落ち着き、月ごとの違いが強 く現れるようになった。また、06 年以降では、年末である 12 月にはコメント数が明らかに少なく なる。この原因として、年末周辺で仕事収めなど生活リズムが変わることで、ユーザーのインター ネットへの接続時間自体が低下しているのではないかと考えられる。一方、07 年では、5 月から 7 月が間に小さな谷を挟んでピークをつくり、08 年では、8 月から 11 月が小さな谷を挟んでピーク を作る。07 年と 08 年でピークをとる月が異なる理由はわからない。年度別で比較するには、まだ

13


 

 

 



   



 

 



 













 





   ! " 図8

 $#%"

 &'"

 

 



 

 ()"

  *+"



年毎、月別のコメント数の推移

!"

 #$

  %&

 '(

図 9 年毎、日別のコメント数の推移

データ量が少ないと思われ、今後、データの継続的な蓄積が求められる。 図 9 は、年毎・日別のコメント数の推移である。図 8 の場合と同様に年を追うごとに日毎の 違いが強く現れるようになった。月末になると減少する傾向が見られるが、31 日が存在する月は

1,3,5,7,8,10,12 月の 7 つの月しかなく、他の日に比べて

7 = 0.58333、確率上、他の日の 5 割強 12

になる。一方、20 日には 07 年、08 年ともピークを作っている。

図 8、図 9 のどちらの図もピーク値を形成しているが、その背景について推測するには、デー タが不足している。年度別で比べると、04 年から 08 年の 5 年しかなく、その内最初の 2 3 年は、 サービス開始初期でユーザーの急な増加から傾向を読み取るには至らず、年別に比較することは難 しい。月別の場合同様、今後のデータの蓄積が求められる。

14


 



 

 

  

    !"

 

 





 



 

  

         

  #$$%& 図 10

#$$(')&

#$$*+&

#$$,-&





 

 

#$$./&

!"

年毎、時間帯別のコメント数の推移

図 11

$#%"

'&("

'')"

'*+"

年毎、分別のコメント数の推移

5.2.3 時間帯別と分別の傾向 次に時間帯別と分別の傾向についての結果である。図 10 は、時間帯別のコメント数の推移で、 図 11 は、分別のコメント数の推移である。図 11 の分別の傾向は特に見当たらない。一方、時間帯 別では、毎年の傾向として深夜 0 時を最大の山として減少し、5 時前後を最小の谷とし、12 時まで 増加する。その後、一度 15 時まで減少してから増加に転じる。これは、インターネット接続時間 と同様の傾向であるとみられ、0 時過ぎから多くのユーザーは就寝し始め、朝 6 時からユーザーは 起床するといったネットに接続する生活リズムに起因していると考えられる。 図 12 に総務省による 2008 年 5 月のブロードバンド接続におけるインターネットトラフィック の推移を示す。図 10 の時間帯別のコメント数の推移とダウンロードのトラフィックの推移は、お おむね相関している。一方トラフィックでは、トピック数に見られる 12 時以降の減少が見られな いし、ピーク値は、トピックのコメント数では 0 時だが、ダウンロードのトラフィックでは 22 時 前後となっており 2 時間早い。mixi のトピックでは、携帯電話からの接続も含まれるためパソコ ンと携帯電話からの接続の違いが影響していると考えられるが、mixi ではパソコンからの利用は 減り、携帯電話による利用は、年々増えていて (図 13)、もし携帯電話からの接続の違いが強い影 響を及ぼしているのであれば、06 年から 08 年は同じ形状ではなく、06 年から 08 年にかけて、よ り変化するはずである。よって、インターネットトラフィックと時間帯別のコメント数の推移の違 いは、携帯電話利用を背景にするとは考えにくい。 そこで、トラフィックと書き込みの違いの背景として、書き込みをしやすい時間帯と閲覧をしや

15


     $# !"    

         









 %'&(*),+.-

/10321)4+5-

図 12 2008/5 ブロードバンド契約者の時間帯別トラフィック 出典: 総務省 我が国のインターネットにおけるトラヒックの集計・試算 2008 年 5 月時点の集計結果

すい時間帯が存在するのではないかと推測する。深夜前後では、ページを見るユーザーが多く、書 き込みも多いが、昼 12 時以降、ページを見るユーザー数は、書き込み量ほど減っていない可能性 がある。書き込みをしやすい時間帯では、コミュニケーションに主眼が置かれているとみられ、一 方、閲覧しやすい時間帯では、情報やコンテンツの閲覧に主眼が置かれていると考えられる。この 2つの違いを明確にできれば、SNS 事業主はそれぞれの時間帯に応じたサービスの提供を考える ことができ、顧客の満足度や収益の向上に繋がる可能性がある。 どのグラフにおいてもいえることだが、各次元のグラフでの最小や最大の背景のついて解明する ことで、SNS 事業主は状況に応じた具体的な施策を考えることができる。しかし、SNS 自体の歴 史が浅く 4 年程度と、扱えるデータ量が少ない。年度別に比較して違いを検証したり、年度によら ず発生する傾向についての知見を得るために今後、継続的に調査していくことが求められる。

16


図 13 mixi ユーザー数の推移 出典:株式会社ミクシィ 2007 年度第 3 四半期事業報告

6 詳細な分析 6.1 べき乗則について べき乗則については、3.1 で一度述べた。べき乗則を生む背景にどういった現象があるのかはま だよくわかっていない。都市の人口と順位や、企業の収入と順位など様々ところで観測される。今 回得た mixi のコミュニティのコメントのデータから、べき乗則に従うと考えられるグラフが幾つ か発見された。今回は、「 あるコメントもしくはトピックに次のコメントがつくまでの日数」とト ピックについたコメント数のグラフについて詳細に分析を行った。グラフの両軸が対数軸であるこ とに注意してもらいたい。べき乗則に従う場合、両対数にプロットすることで、分布が直線に表現 され、全体像の把握がしやすい。

6.2 次のコメントがつくまでの日数 図 14 は、トピックの中で、次のコメントがつくまでの日数の度数による両対数グラフである。 累乗近似したところ y = 163370x−1.7965 で、R2 値は、0.9462 であった。この近似曲線によって、 約 95% の値が予測できる。これにより、存在するトピックとコメントが任意の時間後につけるコ メント量を推測することができる。以下、コメント量の推定に関して述べる。

17


x 日後につくコメントの数をべき乗則として y = ax−n とおくと、まず a は初期値であるから最 初の 1 日間でついたコメントの量を測定し=a とおけばよい。n=定数 とすると、任意の日数 d 日 後、初期値である a に続けてつけられるコメントの予測量は、1 から d までの積分値として次のよ うに表される。

d

ax−n dx

0

この予測量は、初期値のコメントにつく次のコメントである。このコメントに対して、更にコメ ントがつく。k 日後についたコメントに対してつく、更につくコメント量は、

d

ax−n dx

k

となる。初期値 a に対して、任意の日数 d 日後につくコメントの予測量は、次のように表される。

d

1

d

ax−n dxdx

k

よって、n=定数であるとすれば、

a n−1

d

(k −(n−1) − d−(n−1) )dx

1

a 1 ( (1 − d−(n−2) ) − d−(n−2) ) n−1 n−2 これは、初期に存在するトピックとコメントがつける d 日後のコメント量である。したがって、 現実的に d 日後のコメント量を予測するには、新たに増加するトピックを考慮にいれる必要が ある。 正確にコメント量を見積もるには更なる調査が必要だが、コメント量の見積もりは SNS 事業主 にとって有益である。増加していくコメント量が正確に予測できるようになれば、コメントのデー タ量に乗じて、コメントによって増加するデータ量を予測できる。これを用いて、サーバーの容量 を考えれば、適切なサーバー容量の算出から、サーバーのコスト削減に繋がる。SNS 事業主は、こ れらのコメント量の見積もりを行うことによって、早い段階から今後サーバーに必要な投資額を見 積もって、適切な資金計画をたてることができる。

18


     

  1 01

   

 1 20 1

                 (*)%+-, " $ ./&

2 1

01

 

 1 

01  1





00 1





346587:9

;=<?>A@!BAC8D#E FG-H

図 14

  !#"%$ '&

  

;IJELKMNC8DPO-H

次のコメントがつくまでの日数の分布

19

0 1   


6.3 次のコメントがつくまでの日数の推移 次に、y = ax−n の n について考察する。 図 15 は、図 14 と同様のグラフを年別に並べたものである。この時、当てはめた累乗の近似 曲線の値はそれぞれ表 4 のようであった。表 4 の n と R2 に着目する。最小でも、2004 年の

R2 = 0.8577 であり、それぞれの近似曲線で 9 割前後の数値が予測できる。ここで、n 値は、年別 で見ると 04 年の 1.4 から 06 年の 1.7 で山となり 08 年で 1.4 まで減少している。式は、y =

a xn

あるため、n が大きいほど x が同じ値をとっても y は小さくなる。その結果、n が大きいほどコメ ントがつきにくい傾向を表す。つまり、04 年から 06 年にかけてコメントはつきにくくなり、06 年 から 08 年ではコメントがつきやすくなっている。 ここで、n 値の推移に対して予想できる背景について述べる。04 年から、mixi サービス開始初 期はその時代の最先端を嗅ぎ付けるインターネット利用頻度が高いコアなユーザーが多かったと推 測される。そういったコアで積極的なユーザーが多かったので、コメントがつきやすかったと考え られる。以降、サービスが認知されるにつれ、コアでないユーザーが増え、誘われたからとりあえ ず入ってみた、というような比較的消極的なユーザーが増え、コメントがつきにくくなった。そし て、06 年を過ぎると、更に認知度があがり、より多くのユーザーが加入してきた。消極的だった ユーザーでも知り合いが増えたことで、今度は知り合いを中心としたコミュニケーションが多くな り、コメントがされやすくなったと考えられる。湯田ら [5] の研究から得られたネットワークの強 い凝縮性が、06 年以降のコメントをつきやすくしている可能性がある。この検証にあたっては、マ イミクを用いた調査が必要だが、時系列の情報自体は保存されていないため、今後継続的に調査し て、時系列の変化を観測する必要がある。SNS が活用されるためにこのような一連の流れが必要 であるとすれば、y = ax−n の n は、SNS が現在この流れのどこに位置するかを判断する指標とな りうる。サービス開始から 06 年まで、コメントがつきにくくなったが 06 年以降、一転してコメン トがつきやすくなった。新規に SNS を立ち上げた場合、SNS の普及を図る上でこの転機が発生す ることが必要ではないかと推測できる。

SNS は、一定の規模を持たなければ機能しないといわれる。SNS は、コミュニケーションの場 を提供しているが、コミュニケーションは SNS 内でしか行えない。そのため、コミュニケーショ ンをとる相手が SNS 内に所属している必要がある。これを確率的に見た場合、規模が大きいほど コミュニケーションをとれる相手が多いため、mixi や GREE といった大手サイトの独壇場になる といわれた。しかし、厳密にはコミュニケーションをとる相手が所属していればいいため、近年、 地域 SNS などの小規模だがお互いの興味や関係の密度の高い SNS も生まれるよ���になっている。 今回得た、y = ax−n の n 値の変化を観測することで規模の大小によらず SNS が順調に利用され ているかどうかの指標となるのではないかと考えられる。ひいては、この n 値が、新規 SNS サー ビスの継続・撤退を考える上で重要な値となる可能性がある。今回は mixi に限定した調査であっ たが、他の SNS との比較を行うことで、n 値の山となる部分が一定期間内に出現しなければ撤退 もしくは、大幅な方針の転換を考えるべきである、という指標が生まれると考えられる。

20








      









  



!"#!$

図 15

"&%'$

!!"($

"") $

年別の次のコメントがつくまでの日数の分布

21

!!"* $


表4

R2 値

n

a

2004

0.8577

1.4228

492.24

2005

0.9200

1.6576

7533.4

2006

0.9289

1.7002

25071

2007

0.9321

1.6011

25136

2008

0.9200

1.4627

13950

図 15 の年別の近似曲線の値:y = ax−n

6.4 コメント数別のトピック度数分布 図 16 は、コメント数別のトピック数を両対数グラフにプロットしたものである。累乗近似した ところ、y = 2687.9x− 1.2565 で、R2 = 0.7436 である。現状で適合率は 7 割を超えているが、コ メント数が 10 や 1000 周辺で特異な動きをしていることがグラフから読み取れる。この特異な動 きをしている部分だけを分離して説明すれば、有意な近似曲線が得られる可能性がある。 そこで、トピック内のコメントが次のコメントをつける割合について考える。グラフ中央付近の 山は、コメント数 21 のトピック数である。コメント数 21 のトピック数が多い理由として、22 番 目のコメントがつきにくいのではないかと考え、コメントのつきやすさを次のように表現した。 全てのトピックの 1 番目のコメントの総数を C1 と置き、次に全てのトピックの 2 番目のコメ ントの総数を C2 とおく。この時、1 番目のコメントに 2 番目のコメントがつく確率 P1 は、次の ように表される。

C1 × P1 = C2 P1 =

C2 C1

同様に、n − 1 番目のコメントに n 番目のコメントがつく確率 Pn は、n − 1 番目のコメントの総 数、n 番目のコメントの総数をそれぞれ Cn−1 , Cn とすれば、

Pn =

Cn Cn−1

となる。以降、便宜上 Pn を n 番目のコメントの n − 1 番目のコメントに対する出現率と呼ぶ。

0% ≤ Pn ≤ 100% である。

22


      0  /

   

 /            

')(#*,+ " -#%

  /

  

 / 



  /



 +!1&2&3

!#"$&%

  

46578&9;:,<

図 16 コメント数別のトピックの分布

23

   46=?> <!@&A&B6CED

.  /


図 17 に、n に対して Pn をプロットした。この図から全体の傾向として、0 から出現率は上昇 し、200 番目前後で安定してコメントがつくようになり、900 番目以降で急に出現率は低下してい ることがわかる。









  ! 







 







 "$#%'&)(+*

図 17 コメント出現率

24






次に、図 18、19 は、それぞれ n=0∼30 と 950∼1001 部分の拡大図である。まず、0 番目でト ピックの立ち上がりから、1 番目のコメントの出現率は 100% だが、2,3 番目のコメントの出現率 は、どちらも 85% となっている。ここで、底となる 3 番目のコメントについて着目すると、3 番目 のコメントを持つトピックは、立ったトピック総数の 0.85 × 0.85 = 0.723 となり、およそ 7 割の トピックにしか 3 番目のコメントはつかない。以降、出現率は上昇していくが、20 番目まで上昇 したところで、21 番目、22 番目の出現率が大きく低下する。22 番目を越えるとまた出現率は上昇 する。その後、先の図 17 からわかるように 200 以降、出現率は高いまま維持される。そこで、図

19 をみると、955 番目以降、出現率は不安定になり低下し、1001 に至る。 この状況から、トピックにコメントがついていく上で、第 1 の壁が 3 番目のコメント、第 2 の 壁が 22 番目のコメントで、このコメントをとれるかどうかが、コメントがつき続ける上での1つ の鍵となると考えられる。図 18 で、3 番目のコメントを底とし、以降増加を続ける傾向があるこ とから、この第 1 の壁はコメントによるコミュニケーションの構造的な問題ではないかと推測で きる。一方、第 2 の壁である 22 番目のコメントは、この増加傾向と異なり、この部分だけ一気に 減少している。これについては、mixi の Web デザイン上から生まれた問題なのではないか、と推 測できる。mixi のトピックは、コメント数が多くなると最新の 20 件を表示するようになるからで ある。すなわち、21 番目のコメントを書き込むと最初のコメントは別のページに移動してしまう。 そのため、書き込まれたコメントを一通り読むためには、一度ページを移動する必要が生まれてし まう。それが障壁となって出現率を下げた可能性がある。しかし、それだけでは 22 番目のコメン トについては説明できても、21 番目のコメントの出現率が下がったことを説明することはできな い。21 番目のコメントをする時点では、20 件のコメントは全て表示されているからである。この 背景を解明するには、より詳細な調査が必要であり、今回の研究ではこれ以上言及できない。ま た、最後 955 番目以降の出現率の低下の原因としては、次のトピックへの移動が考えられる。1000 になると書き込めなくなるので、ユーザーは、コメント数が 1000 に近づくと、次のトピックをた てる。1001 になる前に新しいトピックに移動していると考えられる。1001 になる前にユーザーが 次のトピックに移動することで、既存のトピックのコメントの出現率が低下しやすくなっていると 推測できる。

25


 



   

  



  

 

    



  

 













 

 

  !#"$&%('

 !#"%$'&)(

図 18



コメント出現率、n=0∼30

図 19

コメント出現率、n=950∼1001

図 20 は、特異点としてあげられた 21、22 コメントと図 19 より出現率が低下を開始するとみら れる 960 番目のコメント以降を削除して新たに近似曲線をあたえたものである。この結果、R2 値 は、0.736 から 0.827 まで向上した。図 20 をよくみると 1000 付近にまだ値が残っていて、近似曲 線を左右している。しかし、この周辺の点ではコメント数が 1,2 の値であり、標本数が少ないこと から、1000 付近の値を上手く近似できなかったと考えられる。調査の精度を上げることによって、 近似曲線の説明力がより高まると考えられる。

26


     +

 

$&%!')(  *"

-   +

  +

 

          

 

,   + 



  +



 .0/

! #" 13254

  13687 .5/59

図 20 調整後のコメント数別のトピックの分布

27

 

  +


7 結論 今回 mixi のコミュニティのトピックの利用状況についての基礎調査を行った。この結果、一日 のコメントの発生は、インターネット接続状況と類似しているが、必ずしも一致するわけではな かった。この違いを生じさせる背景として、書き込みしやすい時間帯や閲覧しやすい時間帯がある のではないかと考えられる。また、近年 mixi のユーザー数の増加が安定してきてから、時間や月 別の特性がより大きく現れるようになっていることがわかった。こういった特性の背景には、ユー ザーの生活上の特性が現れていると予想される。SNS 事業主は、これらのユーザーの特性を利用 することによってコミュニケーションの活性化や広告による収益を増やすことができると考えら れる。 また、詳細な分析では、SNS の凝縮性とそれによるコミュニケーションの傾向を図る指標とし て、トピックにコメントがつくまでの時間を y = ax−n によって近似し、その乗数 n を用いること ができる可能性を示した。この指標が SNS の成長戦略をたてる上で参考になると考えられる。 最後に、コメントの出現率の傾向に特異点があることを示した。特異点の背景としてページデザ インの影響が考えられ、コミュニケーションを阻害している可能性がある。新規の SNS に限らず、 現存する SNS においてもページデザインについて検討する必要がある。

8 成果の活用と今後の課題 SNS 事業主は、これらのユーザーの特性を活用しサービスの展開をしていくことが必要である。 また、今回、これらのユーザーの特性に加え、幾つか説明力の高い近似式を得られた。この近似式 を用い、日毎に増大していくコメントの量を予測することで、SNS 事業主は、早い段階から今後の サーバーに必要な容量を予測することができる。これによって SNS 事業主は、より早くより正確 な投資額を見積もることができ、適切な資金計画をたてることができると考えられる。 今後の課題として、今回の研究の結果現れたユーザーの特性を他の SNS や、掲示板、ブログな ど他のコミュニケーションサービスと比べ、その違いについて検証する必要がある。また、今回収 集したデータは時間、ユーザー、コメント、トピックの 4 変数からなっているが、今回、詳細に分 析できたのは コメント × 時間、コメント × トピック の 2 つのみであり、他の変数の組み合わせに ついて詳細に分析することが必要である。また、年度別で比べるには、SNS の歴史が浅く年毎の データが少ないため、年別に比較したり、年によらず毎年表れる傾向について検証することは難し い。今後、データの継続的な蓄積が求められる。

9 謝辞 本研究を進めるにあたり、ご指導を頂いた川北眞史教授に感謝致します。また、日常の議論を通 じて多くの示唆を頂いた製品産業経営研究室の皆様に感謝します。

28


参考文献 [1] 大向一輝:SNS の現在の展望-コミュニケーションツールから情報流通の基盤へIPSJ Magazine Vol.47 No.9 Sep.2006 [2] Cross,R.andParker,A.:The hidden power of social networks, Harvard Business School Press(2004) [3] Ebel,H.,Mielsch,L.I.andBornholdt,S.:Scale-free topology of e-mail networks, Physical Review E,Vol.66,035103(R)(2002). [4] Tyler,J.R.,Wilkinson,D.M.andHuberman,B.A.:Email as spectroscopy:automated disovery of community structure within origanizations,Proc.1st International Conference on Communities and Technologies,Kluwer B.V.(2003) [5] 湯田聴夫、小野直亮、藤原義久:ソーシャル・ネットワーキング・サービスにおける人的ネット ワークの構造 情報処理学会論文誌 Vol.47 No.3 Mar.2006

[6] 安田雪、松尾豊:SNS における関係形成原理-mixi のデータ分析人口知能学会論文誌 22 巻 5 号 G(2007)

[7] 株式会社インプレス R&D: 拡大する SNS、凝縮する世界 INTERNET magazine 2006-01 [8] 江下雅之:電子掲示板のダイナミズムに関する研究-ライブドア・ショックが電子掲示板の投稿 活動に及ぼした影響目白大学 総合科学研究 3 号 2007 年 3 月 13-33

[9] 石塚満、大澤幸生、松村真弘:テキストコミュニケーションにおける影響の普及モデル 人口知能学会論文誌

17 巻 3 号 SP-B(2002 年) [10] 山本浩一、岡田勇、諏訪博彦、山本仁志:ブログ空間上のコミュニケーション発生メカニズム の分析 日本社会情報学会学会誌 Vol.20 No.1(20080930) pp.29-39

[11] 茂登山清文:情報とデザインについての考察 情報文化学会論文誌 Vol.6 No.1 pp.73 80(1999)

[12] R. Albert, H. Jeong, and A. Barabasi, ” Diameter of the World-Wide Web”, Nature 406, 378-382 (2000)

29


付録 A

詳細資料

A.1 mixi のトピックの収集手順の詳細 A.1.1 トピック収集のクローラの作成 フリーのウェブブラウザ「Firefox」の拡張機能「 iMacros for Firefox」を用いて、クローラを作成し た。src.1 にその javascript ソースを示す。自分の持つアカウントでログインした後、このクロー ラを起動する。mixi のコミュニティのトピックは、ページのアドレスが”http://mixi.jp/view

bbs.pl?id=xxxxxxxx & page=all”と書かれていて、xxxxxxxx にトピックに当てられたIDナン バーを入れるとそのトピックを表示できる。x は0∼9の値である。また、& page¯ all によって、 コメント数が多くなっても一覧で表示できる。この xxxxxxxx に対して、乱数をあてトピックを収 集した。random の最大値 33766171 は、収集直前に調べた最新のトピックにつけられた ID 数で ある。



src1. クローラの詳細



var i, fn,id; for ( i = 1; i <= 100000; i++) { id=Math.floor(Math.random()*37666171)+1; iimPlay("CODE:URL GOTO=http://mixi.jp/view_bbs.pl?id="+id+"&page=all"); fn=id+".htm" iimPlay("CODE:SAVEAS TYPE=HTM FOLDER=* FILE="+fn); } 



2 日間に渡って収集を続けた。その結果、56,575 件を収集した。20 件毎分のペースである。ま た、保存は、”ID.htm”の名前で保存し、重複した場合、上書きして重複を消去している。

A.1.2 公開と非公開の分離 収集したぺージには、既に削除されたページや、非公開のページを含む。よってこれらを分類 する必要がある。Vista 標準のインデックス検索を用いた文書内検索によって分類した。インデッ クス作成の完了を待ってから、次の 3 点の文字列を含むページを分離した。

1. データがありません 2. 非公開のコミュニティのため、コミュニティに参加しないとトピックを見ることは出来ま せん。

3. このコミュニティは非公開のコミュニティのため、アクセスできません。コミュニティに参 加してから、もう一度アクセスして下さい。

30


これらは、該当するテキストの有無によって検出しているため、同テキストを含む書き込みが なされている場合、非公開や削除されていないページであっても、分離されてしまう場合がある。 実際にトピックが生成されている場合、これらの項目に比べ文字量が増えるため、データサイズが 大きくなる。データサイズによって 1. では、8KB 以上、2.3. では、40KB 以上が異常値と推測で きたため、目視で確認した上で分類から除外し、公開ページに戻した。

A.1.3 詳細なデータの収集 正規表現と Grep による抽出・検索を用い、トピックのページ中に含まれる

1. 活動が行われた時間 2. 活動を行ったユーザーのハンドルネーム 3. 活動の内容 の 3 つを抽出した。

A.1.4 母集団へのあてはめ 標本数は、56,985 件。うち、公開ページ数は、22,793 件。母集団となる ID の総数 3,766,171 件なので、標本の占める割合を S とおくと、

S=

56, 985 = 0.01513 3, 766, 171

である。うち公開されていたページの割合を Sp とすれば、

Sp =

22, 793 = 0.040 56, 985

である。収集した任意の値 x に対して、公開されたページとして母集団にあてはめる場合、予想さ れる値 x′p は、

x′p =

x S

更に、非公開のページも公開されたページと同等であると仮定して母集団にあてはめると、その時 予想される値を x’ としたとき、

x′ =

x S × Sp

となる。

A.1.5 2008 年の月別・日別コメント数の予測方法 月の予測は、2008 年 12 月の補正。収集した日が 2008/12/7 であるから、2008 年が終わるま で残りの日数は、31 − 7 = 24 日である。1 年を 365 日とすれば、一年に占める経過した日数は、

365 − 24 × 100 = 93.42% となる。これを = α とおけば、補正値 x は、収集した値 x0 によって 365

次のように表される。

x=

x0 α

よって、2008/12/7 までに得たコメント数 x0 = 151521 より、補正値 x = x0 × α = 162185 と なった。同様にしてトピック数も補正した。 日の予測は 8 日∼31 日を補正した。月の予測で生じた増分を、8∼31 の 23 日に等分した。

31


SNS_mixi_reaerch