パソコン通信、単語出現頻度、ASCII人事異動(月刊ASCII 1991年9月号10) [月刊アスキー廃棄(スクラップ)]
パソコン通信情報ボックスにPC-VANとNIFTY-Serveの会員数があったのでスクラップする。
h12NETWOEKER_W520.jpg)
h12NETWOEKERE382B0E383A9E38395_W520-cc5f8.jpg)
単語の出現頻度を調べた記事があった。
h01E38193E381A8E381B0E9818AE381B3_W520.jpg)
しかし、いまいちであった。もう少し突っ込んでほしいというか緻密に調べて欲しかった。
気にらないのはASCII記事の集計で1文字の単語がリストアップされているところだ。私なら1文字単語を除外して集計する。
「百人一首では,上位の「思」,「人」,「出」,「月」,「恋」,「夜」,「秋」,「山」,「見」……と並べただけで、雰囲気である」は良いと思う。
編集室からをスクラップする。
この漫画が面白かったのでスクラップする。
b14E382ADE383B3E382BFE381AEE5A4A7E58692E999BA_W318.jpg)
h12NETWOEKER_W520.jpg)
h12NETWOEKERE382B0E383A9E38395_W520-cc5f8.jpg)
今月号よりデータで見るパソコン通信の現状をお届けすることにした.第1回は2大サービスに成長したPC-VANとNIFTY-Serveの会員数の推移を紹介する.私は両方加入していた。PC-VANはグラフィック作品鑑賞で作者とコメントをやり取りしたりしていた。NIFTYは専門的な発言のやり取りやプログラムをダウンしたりしていた。結局PC-VANは物足りなくなり止めた。NIFTYは最後まで付き合った。プログラムやハードウエアの改造や専門的な知識を得たりと役だった。NIFTYではオフラインミーティングで実際に知り合い交流を深めることができた。距離を超えて同好の士と交流できるのがパソコン通信の良さだった。
現在、国内第1位の会員数を誇るPC-VANは'86年4月から1年間の実験サービスを経て,'87年4月に有料サービスをスタート.その後,GEnieとのゲートウェイ接続などを実現、さらに24時間サービスの提供などを中心にサービスを拡大し、特定サービスにおける固定料金制の設定などで個人ユーザー層を中心に発展を遂げている.
対するNIFTY-Serveは'87年4月のスタート当初から有料サービスを実施し,各種データベースとのゲートウェイ接続や米国最大のCompuServeとの提携など,一貫したビジネス路線でサービスを提供してきた.全会員の35%を占めるといわれる法人会員の数からもその実態がうかがえる。
NIFTY-Serveでは,同ネットは'92年3月に会員数が33万人に到達するとの見通しを立てている.また,PC-VAN,NIFTY-Serveは共に、'93年3月には会員数がそれぞれ50万人に達するとしている.両ネットが他のBBSに比べて大きく発展を遂げているのは、サービスもさることながら日本各地に設置している100を超えるアクセスポイントの便の良さもあるだろう.今後も、国内のパソコン通信サービスの拡大において,この2大ネットが担う役割は大きいようだ.
単語の出現頻度を調べた記事があった。
h01E38193E381A8E381B0E9818AE381B3_W520.jpg)
しかし、いまいちであった。もう少し突っ込んでほしいというか緻密に調べて欲しかった。
1: | 12399 | (0.932) | 使 |
2: | 7772 | (0.584) | 行 |
3: | 7007 | (0.527) | 場合 |
4: | 6094 | (0.458) | 表示 |
5: | 5975 | (0.449) | 機能 |
6: | 5880 | (0.442) | 込 |
7: | 5742 | (0.432) | 可能 |
8: | 5653 | (0.425) | 出 |
9: | 5189 | (0.390) | 見 |
10: | 5135 | (0.386) | プログラム |
11: | 4949 | (0.372) | ファイル |
12: | 4816 | (0.362) | 利用 |
13: | 4729 | (0.356) | 必要 |
14: | 4668 | (0.351) | 発売 |
15: | 4550 | (0.342) | 使用 |
16: | 4484 | (0.337) | データ |
17: | 4380 | (0.329) | 書 |
18: | 4352 | (0.327) | 思 |
19: | 4327 | (0.325) | 持 |
20: | 4194 | (0.315) | 指定 |
21: | 3760 | (0.283) | 中 |
22: | 3709 | (0.279) | 入 |
23: | 3643 | (0.274) | VER |
24: | 3630 | (0.273) | 作 |
25: | 3575 | (0.269) | 入力 |
26: | 3572 | (0.269) | 同 |
27: | 3535 | (0.266) | 読 |
28: | 3453 | (0.260) | 大 |
29: | 3406 | (0.256) | 取 |
30: | 3401 | (0.256) | 合 |
31: | 3393 | (0.255) | 分 |
32: | 3309 | (0.249) | 方 |
33: | 3296 | (0.248) | MS-DOS |
34: | 3212 | (0.242) | 価格 |
35: | 3186 | (0.240) | 人 |
36: | 3014 | (0.227) | 上 |
37: | 3009 | (0.226) | 多 |
38: | 2955 | (0.222) | 考 |
39: | 2904 | (0.218) | 設定 |
40: | 2882 | (0.217) | ソフト |
41: | 2846 | (0.214) | 呼 |
42: | 2634 | (0.198) | 作成 |
43: | 2605 | (0.196) | 画面 |
44: | 2526 | (0.190) | アプリケーション |
45: | 2500 | (0.188) | 文字 |
46: | 2485 | (0.187) | コンピュータ |
47: | 2390 | (0.180) | 対応 |
48: | 2325 | (0.175) | 実行 |
49: | 2230 | (0.168) | 次 |
50: | 2214 | (0.166) | 他 |
51: | 2211 | (0.166) | 選択 |
52: | 2208 | (0.166) | 言 |
53: | 2171 | (0.163) | 付 |
54: | 2155 | (0.162) | 少 |
55: | 2142 | (0.161) | 実現 |
56: | 2129 | (0.160) | 何 |
57: | 2107 | (0.158) | 切 |
58: | 2103 | (0.158) | 組 |
59: | 2086 | (0.157) | 内容 |
60: | 2073 | (0.156) | 起動 |
61: | 1992 | (0.150) | 搭載 |
62: | 1982 | (0.149) | 変更 |
63: | 1972 | (0.148) | 特徴 |
64: | 1954 | (0.147) | ユーザー |
65: | 1927 | (0.145) | 処理 |
66: | 1924 | (0.145) | 実際 |
67: | 1923 | (0.145) | 紹介 |
68: | 1922 | (0.145) | 今回 |
69: | 1890 | (0.142) | 新 |
70: | 1872 | (0.141) | 簡単 |
71: | 1850 | (0.139) | パソコン |
72: | 1846 | (0.139) | マウス |
73: | 1818 | (0.137) | ソフトウェア |
74: | 1815 | (0.136) | 対 |
75: | 1812 | (0.136) | 主 |
76: | 1803 | (0.136) | 動 |
77: | 1785 | (0.134) | 操作 |
78: | 1782 | (0.134) | 変 |
79: | 1781 | (0.134) | 点 |
80: | 1779 | (0.134) | 開発 |
81: | 1740 | (0.131) | 押 |
82: | 1730 | (0.130) | 動作 |
83: | 1725 | (0.130) | EXE |
84: | 1691 | (0.127) | 表 |
85: | 1663 | (0.125) | 自分 |
86: | 1660 | (0.125) | 高 |
87: | 1657 | (0.125) | 違 |
88: | 1657 | (0.125) | コマンド |
89: | 1651 | (0.124) | システム |
90: | 1643 | (0.124) | 問題 |
91: | 1641 | (0.123) | 情報 |
92: | 1629 | (0.123) | 部分 |
93: | 1613 | (0.121) | マシン |
94: | 1612 | (0.121) | ゲーム |
95: | 1606 | (0.121) | ウィンドウ |
96: | 1604 | (0.121) | ウィンドウ |
97: | 1600 | (0.120) | 発表 |
98: | 1589 | (0.119) | 移動 |
99: | 1587 | (0.119) | 方法 |
100: | 1587 | (0.119) | 先 |
101: | 1577 | (0.119) | HDD |
102: | 1561 | (0.117) | 装備 |
103: | 1558 | (0.117) | ディスク |
104: | 1544 | (0.116) | 現在 |
105: | 1544 | (0.116) | 含 |
106: | 1520 | (0.114) | 替 |
107: | 1519 | (0.114) | 楽 |
108: | 1515 | (0.114) | OS |
109: | 1501 | (0.113) | 接続 |
110: | 1489 | (0.112) | 採用 |
111: | 1467 | (0.110) | 気 |
112: | 1455 | (0.109) | CPU |
113: | 1439 | (0.108) | 後 |
114: | 1436 | (0.108) | 知 |
115: | 1403 | (0.106) | 話 |
116: | 1391 | (0.105) | メモリ |
117: | 1389 | (0.104) | メニュー |
118: | 1369 | (0.103) | 時間 |
119: | 1355 | (0.102) | ディレクトリ |
120: | 1355 | (0.102) | サポート |
121: | 1350 | (0.102) | ハードディスク |
122: | 1338 | (0.101) | 手 |
123: | 1334 | (0.000) | 出力 |
124: | 1327 | (0.000) | 状態 |
125: | 1325 | (0.100) | 割 |
126: | 1315 | (0.099) | 始 |
127: | 1310 | (0.099) | 前 |
128: | 1308 | (0.098) | MAC |
129: | 1302 | (0.098) | サイズ |
130: | 1300 | (0.098) | 扱 |
131: | 1297 | (0.098) | 日本 |
132: | 1284 | (0.097) | 問 |
133: | 1283 | (0.096) | 同樣 |
134: | 1277 | (0.096) | 示 |
135: | 1272 | (0.096) | 付属 |
136: | 1265 | (0.095) | 内蔵 |
137: | 1257 | (0.095) | 私 |
138: | 1255 | (0.094) | 最初 |
139: | 1253 | (0.094) | 登録 |
140: | 1252 | (0.094) | 関 |
141: | 1242 | (0.093) | 従来 |
142: | 1241 | (0.093) | キーボード |
143: | 1235 | (0.093) | 別 |
144: | 1234 | (0.093) | 今 |
145: | 1230 | (0.092) | MACINTOSH |
146: | 1229 | (0.092) | 特 |
147: | 1227 | (0.092) | IBM |
148: | 1226 | (0.092) | 意味 |
149: | 1204 | (0.091) | オプション |
150: | 1200 | (0.090) | 同時 |
151: | 1199 | (0.090) | 文字列 |
152: | 1186 | (0.089) | 置 |
153: | 1178 | (0.089) | 続 |
154: | 1157 | (0.087) | 感 |
155: | 1154 | (0.087) | SYS |
156: | 1148 | (0.086) | 選 |
157: | 1143 | (0.086) | 数 |
158: | 1119 | (0.084) | 編集 |
159: | 1119 | (0.084) | 受 |
160: | 1109 | (0.083) | ワープロ |
161: | 1104 | (0.083) | 返 |
162: | 1100 | (0.083) | 予定 |
163: | 1097 | (0.082) | 続 |
164: | 1086 | (0.082) | 関数 |
165: | 1084 | (0.082) | 買 |
166: | 1079 | (0.081) | 小 |
167: | 1075 | (0.081) | マニュアル |
168: | 1073 | (0.081) | 作業 |
169: | 1072 | (0.081) | 登場 |
170: | 1071 | (0.081) | プログラミング |
171: | 1068 | (0.080) | 例 |
171: | 1068 | (0.080) | 名前 |
173: | 1067 | (0.080) | 異 |
174: | 1066 | (0.008) | 複数 |
175: | 1062 | (0.080) | 当 |
176: | 1058 | (0.080) | 検索 |
177: | 1054 | (0.079) | プリンタ |
178: | 1042 | (0.078) | 用 |
179: | 1042 | (0.078) | 販売 |
180: | 1035 | (0.078) | 定義 |
181: | 1034 | (0.078) | 引 |
181: | 1034 | (0.078) | COM |
183: | 1028 | (0.077) | 加 |
184: | 1024 | (0.077) | 比 |
185: | 1022 | (0.077) | 目 |
186: | 1022 | (0.077) | 図1 |
187: | 1018 | (0.077) | アスキー |
188: | 1017 | (0.076) | 間 |
189: | 1017 | (0.076) | 換 |
190: | 1003 | (0.075) | 送 |
191: | 1001 | (0.075) | 形 |
192: | 1000 | (0.075) | 写真1 |
193: | 997 | (0.075) | 便利 |
194: | 994 | (0.075) | 並 |
195: | 991 | (0.075) | 非常 |
196: | 982 | (0.074) | キー |
197: | 981 | (0.074) | 生 |
198: | 973 | (0.073) | 変換 |
199: | 970 | (0.073) | PC |
200: | 955 | (0.072) | 製品 |
結果はどうなったか?
うまく出現頻度順一覧をもとめることができただろうか?今回のテーマである本誌の記事テキストファイルにおける出現頻度順一覧もなんとかもとめることができた。
また、本誌でも「ハッキーズ・ディッシュ」でお馴染のシェフネットジャパン(料理専門ネット)のジャンクフードボードの'91年6月までの書き込み,聖書刊行会による「改訂新訳聖書」のテキスト,小倉百人一首,筆者が'91年3月号まで本誌で連載した「近代プログラマの夕」の原稿の現存分についても集計してみた.表1では,本誌'89年2月号~'91年5月号のテキストファイルでの単語の出現順位と出現回数,出現比率をまとめてある.
本誌の記事で注目すべきは,「使」が,出現した1329735単語,156328種類の中で,ダントツの出現頻度第1位に輝いている点だろう.今回の手順では「漢字やカタカナや英数字の連続」を単語とみなしているために1文字だけ出てきてしまったが,実際には「使う」や「使える」などだろう.上位に食い込んでいる単語は,いずれもパソコンのハード・ソフトの説明に頻繁に使われる単語だけが独占している.
ソフト名のトップは,33位のMS-DOSの3296回ということになるが,実際には,前後に漢字やカタカナ,後ろにバージョン番号がついているケースもあるだろう。実際にMS-DOSという文字列が登場した回数は,はるかに多いと思われる.なお,ハードウェアの名前では,Macとなった.
ところで,上位よりも泡沫の1回か2回しか登場しなかった単語も,見ているとなかなか面白い.「電動歯ブラシ」の1回は,いまはUNIXマガジンの竹田が'90年11月号のお掃除企画記事で,「踊子」という単語が2回使われていると思ったら2回とも国友正彦氏の原稿(正確には図)中だった.
シェフネットジャパンの集計では,「食」がトップというのはさすがだが,「飯」,「納豆」,「牛乳」,「マヨネーズ」,「チーズ」あたりも結構上位に入っている.ジャンクフードボードならではというところだろう.
「新訳聖書」では,「私」,「人」,「言」,「彼」,「イエス」,「者」,「神」までが,それ以外の単語に比べて格段に多い。ちなみに4位で1885回登場している「イエス」は,本誌では2年3カ月の間にもわずか4回しか登場していない。もっとも,それらすべてが「イエス」の「イエス」かどうか分からない.百人一首では,上位の「思」,「人」,「出」,「月」,「恋」,「夜」,「秋」,「山」,「見」……と並べただけで、雰囲気である.
「近代プログラマの夕」では、数百年前の「百人一首」と同じように「思」がトップとなった。実は,一般的な日本語ではこのような結果になるのだという話を聞いた.
今回は,MIFESとSORT,およびUNIQを使って,単語の出現頻度を中心にもとめてみた。もっとも、今回のような作業は,どちらかといえば本誌「AWKビレッジ」でお馴染みのjgawkなどで,スクリプト(プログラム)を書いて実行するほうが一般的かもしれない(単語の切り出しを行なうjgawkのスクリプトについてはリストページに掲載した)。
MIFESは,日本語が使えるものでは数少ない検索・置換で正規表現が使えるエディタである.たとえば,
'麹町アジャ|AJANTA|ajanta
で検索すれば,表現の揺れを吸収して目的の単語の検索ができる.テキストファイル上でさまざまな試行錯誤的な作業を行なうのに威力を発揮するのだ。
さて、次回は,今回もとめたいくつかの出現頻度順の分析を試みることにしよう. (Hortense Endoh)
気にらないのはASCII記事の集計で1文字の単語がリストアップされているところだ。私なら1文字単語を除外して集計する。
「百人一首では,上位の「思」,「人」,「出」,「月」,「恋」,「夜」,「秋」,「山」,「見」……と並べただけで、雰囲気である」は良いと思う。
編集室からをスクラップする。
盛夏,ニュースが飛んでくる1991年はマイコンからBasic,MS-DOSパソコンの時代に関わってきた人たちが動き出した年だった。これからはWindowsの時代になってコンピュータ環境は全く変わってしまう。一般ユーザはプリインストールマシンを買ってマウスを使ってパソコンを操作する時代になった。MS-DOSからコマンドを打ち込む必要はなくなり、ファイル名を入力する必要もなくなりパソコンの基本的知識がなくてもソフトウエアを使うことができるようになった。時代は変わる。
▲この十数日の間にいくつかのニュースが入ってきた。1つは,弊社アスキーの会長、副社長の辞任。アスキーの発足メンバー3人のうち西和彦社長を残す,他の2人,郡司明朗会長と塚本慶一郎副社長が7月中旬で退社となった。この件の経緯は,これを書いている時点(7月20日)までに新聞などに書かれたものと大きくは変わらない.
長年にわたって出版局を担当してこられ,本誌の発行人でもあった塚本慶一郎氏には,この場を借りて,深くお礼を申し上げたいと思う.また,本誌とおつき合いのある方々から,いろいろご心配をいただいていたが,今後ともいっそうの誌面の充実,発展を目指していくつもりである.
▲同じ日に飛び込んできたのがIBMとAppleの技術提携についてのニュースである。その日の深夜、通常の配信時間外に時事ファクスビープ音とともにニュースを送ってきた.コンピュータ界の巨人,パーソナルコンピュータの分野でも世界的な標準であるIBM PCを作り上げたIBM.それと真っ向から対立する図式にあったパーソナルコンピュータそのものともいえるメーカーApple.彼らが,なかよく握手することになろうとは,1年前に誰が想像しただろうか?「ASCI EXPRESS」の“Miscellaneous :behind the news"のページでも報じているが,まだ,これからどのように話が進むのか見えていないのだが.
▲IBMとAppleのニュースの数日後,『Wall Street Journal』が,日本市場での米コンピュータメーカーについてレポートしている.
PS/55Zシリーズによるコンシューマ市場での展開をねらう日本IBM.ローエンドモデルが好調で,'95年までに10%の市場シェアをめざすアップルコンピュータジャパン,そして,IBM PC互換マシンのトップメーカーCompaqの日本法人設立へと話が続く.今後のハードウェア,とくにノートパソコンでは,完全に先行する形となった日本メーカーの本拠地としての意味や重要性,難しさも指摘する.さまざまな動きの向こうにあるのは,ワークステーション分野との接点とマルチメディアと小型化技術だが……. (遠藤諭)
この漫画が面白かったのでスクラップする。
b14E382ADE383B3E382BFE381AEE5A4A7E58692E999BA_W318.jpg)
コメント 0