Submit Search
KH Coder 3 チュートリアル(スライド版)
0 likes
•
90,393 views
khcoder
KH Coder 3による計量テキスト分析(テキストマイニング)を行なう手順のチュートリアル。題材として漱石「こころ」を使用。
Software
Read more
1 of 32
Download now
Downloaded 40 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Most read
19
Most read
20
Most read
21
22
23
24
25
26
27
28
29
30
31
32
More Related Content
What's hot
(20)
PPTX
特徴ベクトル変換器を作った話 #dogenzakalt
Tokoroten Nakayama
PDF
形態素解析
Works Applications
PDF
Prophet入門【理論編】Facebookの時系列予測ツール
hoxo_m
PDF
カネとAgile(大企業新規事業編) #rsgt2021
Itsuki Kuroda
PPTX
トピックモデルの基礎と応用
Tomonari Masada
PDF
楽にggplotを描く・整える
daiki hojo
PDF
開発速度が速い #とは(LayerX社内資料)
mosa siru
PDF
サービス開発における フロントエンド・ドメイン駆動設計の実践
TakefumiYoshii
PDF
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
. .
PDF
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
Y-h Taguchi
PPTX
Docker超入門
VirtualTech Japan Inc.
PDF
トランザクションスクリプトのすすめ
pospome
PDF
機械学習をScrumで組織的に学習する (RSGT2022)
Yukio Okajima
PDF
自己紹介:機械学習・機械発見とデータ中心的自然科学
Ichigaku Takigawa
PDF
LDA入門
正志 坪坂
PDF
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
Hironori Washizaki
PDF
DX時代のITエンジニアに送る、アジャイル式「いきいき」ヘルスマネジメント
Takeshi Kakeda
PDF
ReactとSeleniumの幸せな関係
Akira Kuratani
PDF
金融×AIで解くべき問題は何か?
Tsunehiko Nagayama
PDF
POLITIQUE SOCIALE - CONDITIONS DE TRAVAIL - EMPLOI
Groupe Alpha
特徴ベクトル変換器を作った話 #dogenzakalt
Tokoroten Nakayama
形態素解析
Works Applications
Prophet入門【理論編】Facebookの時系列予測ツール
hoxo_m
カネとAgile(大企業新規事業編) #rsgt2021
Itsuki Kuroda
トピックモデルの基礎と応用
Tomonari Masada
楽にggplotを描く・整える
daiki hojo
開発速度が速い #とは(LayerX社内資料)
mosa siru
サービス開発における フロントエンド・ドメイン駆動設計の実践
TakefumiYoshii
『予測にいかす統計モデリングの基本』の売上データの分析をトレースしてみた
. .
『主成分分析を用いた教師なし学習による変数選択』 を用いたデング出血熱原因遺伝子の推定
Y-h Taguchi
Docker超入門
VirtualTech Japan Inc.
トランザクションスクリプトのすすめ
pospome
機械学習をScrumで組織的に学習する (RSGT2022)
Yukio Okajima
自己紹介:機械学習・機械発見とデータ中心的自然科学
Ichigaku Takigawa
LDA入門
正志 坪坂
ソフトウェアパターン概論およびパターンを活用したアーキテクチャ設計
Hironori Washizaki
DX時代のITエンジニアに送る、アジャイル式「いきいき」ヘルスマネジメント
Takeshi Kakeda
ReactとSeleniumの幸せな関係
Akira Kuratani
金融×AIで解くべき問題は何か?
Tsunehiko Nagayama
POLITIQUE SOCIALE - CONDITIONS DE TRAVAIL - EMPLOI
Groupe Alpha
Similar to KH Coder 3 チュートリアル(スライド版)
(19)
PDF
【旧版】KH Coder 3 チュートリアル(スライド版)
khcoder
PDF
Cocos2d-x公開講座 in 鹿児島
Tomoaki Shimizu
PPTX
超効率的フロントエンドデバッグ術
Shinji Hashimoto
PDF
Code igniterでテスト駆動開発 資料作成中
Takako Miyagawa
PDF
Macでcocos2d-x 2.1.3を使用した、iOSアプリの開発環境構築について
Tomoaki Shimizu
KEY
Cq tse-fm3セミナー資料
Masaki Muranaka
PPT
IEとメモ帳でかんたんゲーム開発
amusementcreators
PPTX
20160422_lombokについて
Hidaka Kazutaka
PDF
さわってみよう Firefox OS in 福岡
Honma Masashi
PDF
Play with DockerでDocker学習環境を整えよう!
Hori Tasuku
PPTX
Andoird版OpenCVのJavaサンプルを動かす
shobomaru
PPTX
First vr sdk_introduction
SatoshiHosono
PDF
さわってみよう Firefox OS in 大阪
Honma Masashi
PDF
Macでcocos2d-x 2.1.2を使用した、Androidアプリの開発環境構築について
Tomoaki Shimizu
PDF
Algyan@how to dragon board410c20170930
Hiroshi Hasegawa
PDF
LibreOfficeをWindows上でビルドする
Tomofumi Yagi
PDF
ADX2LE GGJ13向けワークショップ
Takashi Tanaka
PDF
コンテナを突き破れ!! ~コンテナセキュリティ入門基礎の基礎~(Kubernetes Novice Tokyo #11 発表資料)
NTT DATA Technology & Innovation
PDF
DLR言語によるSilverlightプログラミング
terurou
【旧版】KH Coder 3 チュートリアル(スライド版)
khcoder
Cocos2d-x公開講座 in 鹿児島
Tomoaki Shimizu
超効率的フロントエンドデバッグ術
Shinji Hashimoto
Code igniterでテスト駆動開発 資料作成中
Takako Miyagawa
Macでcocos2d-x 2.1.3を使用した、iOSアプリの開発環境構築について
Tomoaki Shimizu
Cq tse-fm3セミナー資料
Masaki Muranaka
IEとメモ帳でかんたんゲーム開発
amusementcreators
20160422_lombokについて
Hidaka Kazutaka
さわってみよう Firefox OS in 福岡
Honma Masashi
Play with DockerでDocker学習環境を整えよう!
Hori Tasuku
Andoird版OpenCVのJavaサンプルを動かす
shobomaru
First vr sdk_introduction
SatoshiHosono
さわってみよう Firefox OS in 大阪
Honma Masashi
Macでcocos2d-x 2.1.2を使用した、Androidアプリの開発環境構築について
Tomoaki Shimizu
Algyan@how to dragon board410c20170930
Hiroshi Hasegawa
LibreOfficeをWindows上でビルドする
Tomofumi Yagi
ADX2LE GGJ13向けワークショップ
Takashi Tanaka
コンテナを突き破れ!! ~コンテナセキュリティ入門基礎の基礎~(Kubernetes Novice Tokyo #11 発表資料)
NTT DATA Technology & Innovation
DLR言語によるSilverlightプログラミング
terurou
Ad
More from khcoder
(8)
PDF
Quick Start Tutorial of KH Coder 3
khcoder
PDF
[OUTDATED] Quick Start Tutorial of KH Coder 3
khcoder
PDF
Jaccard係数の計算式と特徴(2)
khcoder
PDF
Jaccard係数の計算式と特徴(1)
khcoder
PDF
Executing SQL Queries and Making Plugins
khcoder
PDF
Example of Using R #1: Exporting the Result of Correspondence Analysis
khcoder
PDF
Quick Start Tutorial of KH Coder 2: Quantitative Content Analysis or Text Min...
khcoder
PDF
Rファイルの保存と活用1―KH Coderによる対応分析の結果のエクスポートと活用―
khcoder
Quick Start Tutorial of KH Coder 3
khcoder
[OUTDATED] Quick Start Tutorial of KH Coder 3
khcoder
Jaccard係数の計算式と特徴(2)
khcoder
Jaccard係数の計算式と特徴(1)
khcoder
Executing SQL Queries and Making Plugins
khcoder
Example of Using R #1: Exporting the Result of Correspondence Analysis
khcoder
Quick Start Tutorial of KH Coder 2: Quantitative Content Analysis or Text Min...
khcoder
Rファイルの保存と活用1―KH Coderによる対応分析の結果のエクスポートと活用―
khcoder
Ad
KH Coder 3 チュートリアル(スライド版)
1.
KH Coder 3
チュートリアル 漱石『こころ』を題材に 【スライド版】 1
2.
本チュートリアルの内容 2 1. KH Coderの準備 2.
プロジェクト作成と前処理 3. 頻出語と共起 4. それぞれの部(上・中・下)に特徴的な語 5. コーディングによるコンセプトの抽出
3.
3 1. KH Coderの準備
4.
4 ② クリック ③ 「unzipped
successfully」 の表示が出れば完了なので、す べての画面を閉じる 1.1 インストール(解凍) KH Coderは解凍(Unzip)するだけで利用可 ① ダウンロードしたファ イルをダブルクリック ※ノートンやウイルスバスターに「危険なソフト」と誤判定される場合があります。ノートン等 を一時的に無効にすると動作するようですが、この操作は自己責任でお願いいたします。
5.
5 1.2 KH Coderの起動方法 ①
デスクトップに作成された アイコンをダブルクリック ② 解凍先フォルダが開くので、 「kh_coder.exe」をダブルクリック ※PCの設定によっては、 「kh_coder」 のように、ファイル名の 「.」ピリオド以降を省略した状態で表示されます。
6.
6 2. プロジェクト作成と 前処理
7.
【解説】分析のねらいと進め方 7 本ページのようにタイトルが【解説】で始まるページ では操作不要です。お読みいただくだけで結構です。 漱石『こころ』の探索的分析 物語最後の「先生」の自殺が突然で不自然とい う批判はもっともか? 『こころ』の人間観、人間の罪とは? 分析の手順は大きく分けて2段階 語を自動的に取り出して集計し、予断を交えず にデータの全体像を探る コーディングを行うことで、分析者の観点を 活かしてコンセプトを取り出し、分析を深める
8.
【解説】データの準備 8 『こころ』は上・中・下の 3部構成。部の中がさらに一 ・二・三などの章に分かれる Excelで1つの列にテキストを 入力し、ほかの列にテキスト 以外の情報(今回は部や章の 番号)を入力。テキスト以外 の情報のことを「外部変数」 と呼ぶ。 1行目に列の名前を入力 2行目からデータを入力 1つ目のシートに入力 ※データ量が多くてKH Coderで エラーになる場合、CSV形式で 保存してからKH Coderへ
9.
2.1 プロジェクト作成(分析するファイルを指定) 9 ① メニューから「プロジェクト」 「新規」をクリック ②
「参照」 をクリックして 「tutorial_jp」フ ォ ル ダ 内 の 「kokoro.xls」(Excelアイコ ン)を開く ④ クリック 次回KH Coderを起動した時は「新規」ではなく、「プロジ ェクト」「開く」を選択して、既存のプロジェクトを開く この部分を「メニュー」と呼ぶ ③「テキスト」 列と「日本語」 が選択されていることを確認
10.
2.2 強制抽出する語の指定 10 ① メニューから「前処理」「語の取捨選択」を選択 ②
「一人」「二人」と入力 ③ クリック 重要な言葉なのに、 1語として抽出されな い時は「強制抽出」 「一」と「人」に 分 か れ てしまうような、分割 が細かすぎる場合に も有効 細かすぎる分割を洗 い 出 す に は「前 処 理」 「複 合 語 の 検 出」コ マ ンドが便利
11.
2.3 前処理の実行 11 「前処理」 とはテキスト 中から自動的に語を取 り出して分析の準備を する処理 この処理を実行してお かないと分析は行なえ ない ①
メニューから「前処理」「前処理の実行」を選択 ② クリック
12.
12 3. 頻出語と共起ネットワーク
13.
3.1 抽出語リスト 13 ① メニューから「ツール」 「抽出語」「抽出語リスト」 小説なので主要人物が上位に 「死ぬ」が89回と多く出現? 「一人」より「二人」の方が多い! 活用のある語は基本形に直し て抽出&カウント ex.「知らない」→「知る」 ②
番号をクリックで活用形を表示 ③ 抽出語をクリッ クすると「KWICコ ンコーダンス」へ
14.
3.2「KWICコンコーダンス」1/2 14 分析結果中の語をク リックすればこの画 面が開く 数値だけでなく語の 前後の文脈 (context) を見るの が大切 KWIC =
Key Word In Context ① ダブルクリックでさら に広い範囲の文脈を表示 ② 「集計」をクリックする と「コロケーション統計」へ
15.
3.2「KWICコンコーダンス」2/2 15 ① 前ページの手順で「コロケーション統計」が開く ② クリックすれば特定 の品詞の語だけを表示可 「左1」とは、左側の1つ目、すな わち直前に出現していた回数のこと 「父」は「死ぬ」の2語前に7回出現した 前後に多く出現していた語を 通じて、検索対象語がもとの テキスト中でどう使われてい たかという文脈をうかがえる
16.
3.3 共起ネットワーク 16 ① メニューから「ツール」「抽出語」「共起ネットワーク」→「OK」 入力Excelファイルの同じセル内によ く一緒に出現する語(共起する語)を、 線で結んだネットワーク。強く結び ついた部分ごとに自動的にグループ 分け&色分け。 「調整」をクリックすれば各種オプションを変更可。 Ex.
線(edge)の本数を「上位 60」から「100」へ。 ② 抽出語をクリックすると 「KWICコンコーダンス」へ 「保存」をクリック すれば画像ファイル として保存可。
17.
【解説】語の共起を探索する方法 17 複数の方法の中から選択可 共起する語のグループから、データ中のテー マないしトピックを探索できる これらの分析には内部で「R」という統計ソフト ウェアを使用 共起ネットワーク 自己組織化マップ MDS クラスター分析 ※自己組織化マップは長時間を要するので注意
18.
18 4. それぞれの部(上・中・下)に 特徴的な語 ――特徴語 &
対応分析――
19.
4.1 それぞれの部の特徴語一覧 19 ② 「部」をクリック ③
「文」を選択 ④ 「特徴語」「一覧(Excel形式)」を選択 ① メニューから「ツール」「外部変数と見出し」 3つの部(上・中・下)の 特徴語が上位10語ずつリ ストアップされる。
20.
【解説】特徴語からみる物語の流れ 20 上では主人公と「先生」 が交流を深めていく。しか し「先生」の話はよく「解 ら」ないことも多い。 Ex. 「先生の話のうちでただ一つ底まで聞きたかったのは,人間がいざと いう間際に、誰でも悪人になるという言葉の意味であった。単なる言葉と しては、これだけでも私に解らない事はなかった。しかし…」(上二九) 中では主人公が実家に戻 り「父」「母」との会話 が多くなる。「先生」と も「手紙」をやりとり。 下は「先生」が主人公 に送った長い遺書。親 友「K」と「お嬢さん」 との三角関係などを通 じて、上では主人公に も読者にも「解ら」な かった事柄が明らかに。
21.
4.2 「対応分析」による視覚的な探索 21 ① メニューから「ツール」「抽出語」「対応分析」 ②「部」が選択され ていることを確認 ③
クリック 部(上・中・下)の 特徴をグラフィカル に探索できる
22.
【解説】「対応分析」の見方 22 原点(0, 0) ① 原点(0,
0)付近に はこれといって特徴 のない語が集まる ② 原点(0, 0)から見て、 「上_先生と私」の方向 にある語、そして原点 から離れている語ほど、 上に特徴的! ※特徴語の一覧から読み 取れた上・中・下の特徴 と、ほぼ同じ特徴を対応 分析からも読み取れる。 ③ 同様に、原点(0, 0) から見て「中_両親と 私」の方に離れている 語ほど、中に特徴的! 下も同じ。
23.
23 5. コーディングによる コンセプトの抽出
24.
24 *人の死 死ぬ or 殺す
or 亡くなる 語ではなくコンセプトを数えたい場合もある 例えば「人の死」というコンセプトは、「死ぬ」だけ でなく「殺す」という語でも表現される コンセプトを数えるためのコーディングルール 【解説】 コーディングとは コード(コンセプト)の名前 コードを付与する条件。「死ぬ」 「殺す」「亡くなる」のどれかが出 現している文書は、「*人の死」に 言及していたと見なされる。 チュートリアルで使用 する「theme.txt」
25.
5.1 コーディングルールによる検索 25 ① メニューから「ツール」「文書」「文書検索」 ②
「参照」をクリックして「tutorial_jp」 フォルダ内の 「theme.txt」を開く ④ ダブルクリック ⑤ ダブルクリックでセル全体を表示 コーディングルール作成時には、どのような文書にコード が付与されているかを検索・確認することが大切 ③ H5を選択 Excelの1つ1つのセ ル を KH Coder は 「H5」 と認識。H5を 選択するとセル単位 の検索に。
26.
5.2 コードのクロス集計(部ごと) 26 ① メニューから「ツール」「コーディング」「クロス集計」 ②「参照」をクリックして「theme.txt」を開く ※
「theme.txt」 とすでに表示されている場合は操作不要 ⑤「バブル」をクリック してプロットを作成 ④「集計」をクリック 各コードが、どの部で 多く出現していたかを 示すプロット ③ H5を選択 「下」 では300セルの うち18セル (6%)が *友情に言及
27.
【解説】部ごとの集計から見る物語の流れ 27 ① 下では3角関係の いきさつから親友が 自殺。そのため「恋 愛 」
「 友 情 」 「 信 用・不信」が多い。 ② 中では病気で死に瀕する 「父」の様子が描かれる。 ③ 中・下のよ うな人物の死は 描かれていない の に 、 上 で も 「人の死」が一 定数出現。 なぜ? 次の分析で確認!
28.
5.3 コードのクロス集計(章ごと) 28 ① 5.2に続けて以下の操作を行う ②「文」を選択 ⑤「選択」「人の死」を クリックしてグラフを作成 ④「集計」をクリック ③「章」を選択 「人の死」コードが どの章で多く出現し ていたかを見る折れ 線グラフ
29.
【解説】「人の死」の推移から 1/3 29 ① 自殺の直前だけを見 ると、「先生」はかな り急激に決意を固めて いるようにも見える。 ②
しかし物語全体に視 野を広げると、「先生」 が死ぬことに執着してい る様子が、上でも詳細に 描かれている。 Ex. 「…先生の話は,容 易に自分の死という遠い 問題を離れなかった。そ うしてその死は必ず奥さ んの前に起るものと仮定 … 」(上三五) 上三五 上二四
30.
【解説】「人の死」の推移から 2/3 30 上三五 上二四③ 自殺の理由の一部には、お 金や恋に切羽詰まれば誰でも悪 人になる、人間一般への失望 Ex.
「…自分もあの叔父と同じ人間だと意識 した時…。他に愛想を尽かした私は、自分に も愛想を尽かして動けなくなったのです」 (下五二)
31.
【解説】「人の死」の推移から 3/3 31 上三五 上二四 ④ 自殺が突然で 不自然という批判 はちょっと漱石に 対して酷では? 計量テキスト分析 の利点として: データ全体を見 渡す視点が得ら れる 目で読むべき特 徴的な部分はど こか探索できる
32.
おわりに 32 各操作の意味や結果の読み取り方についてより詳し くは、「KH Coderの本」第3章をご参照ください。 『社会調査のための計量テキスト分析 第2版』 (樋口耕一著,ナカニシヤ出版,2020) 謝辞 本チュートリアルの作成と改善にあたっては、立命 館大学産業社会学部ならびに大学院社会学研究科の 皆さまにご協力いただきました。 第2版では、よりよい分析・活用の ために研究事例のレビューを増補し、 KH
Coder 3にも対応しました。
Download