データマイニング

2008.05.01

【二重の驚き】上田太一郎さん2007年逝去

データマイニングのメルマガから上田太一朗さんが2007年に亡くなられていたことをしりました。
web検索で以下の記事を発見。しかもこの記事は知人のblogだったのです。
今の私のレポート作成のスタイル確立に影響があった方で非常に驚いています。

上田太一郎先生が亡くなられたと
友人から連絡をいただいた。
昨夜がお通夜、今日告別式とのこと。

上田太一郎先生は、言わずと知れた、
データマイニングの大御所。

今日はめずらしく朝から動揺しています。

| | コメント (0) | トラックバック (0)

2006.03.03

勝手に犯罪マップ

2006/1/9のフジサンケイビジネスアイに以下の記事がありました。これは友人のNさんが見つけた記事でした。

自分でも何かマイニングができないか?と思っていたら、事務所ですてきなデータに出くわしました。
それは、2005年の所轄警察署管内地区ごとの犯罪発生件数です。
エクセルに入力して、アドインで双対尺度法を実施してみると、

1)車上ねらいと空き巣は地区的に傾向があります。
2)自転車泥棒も隣接した地区で発生しています。
これと地図を眺めると何か対策も浮かぶかもしれません。
クリックすると画像が大きくなります。
hanzai

元データ
hanzai2

>お手柄半兵衛 1月9日付 23面
>N
>「コンピュター事件分析システム <半兵衛>が犯人割り出す/
>神奈川県警」川崎市で20数件発生した眼鏡やコンタクトレンズ
>ばかり狙う風変わりな連続窃盗事件、犯人を割り出したのは、1
>人の警官が作り上げた独自の事件分析システム「半兵衛」でした。


| | コメント (0) | トラックバック (0)

2005.12.08

たまに使うエクセルの関数 concatenate()

年に数回のオーダーでしか使わないエクセルの関数。
言葉と言葉をつなぎます。
concatenate つづりが難しい。覚えにくい、でblogに記録。安易に今日も更新です。

おまけにヘルプを掲載、クリックすると大きくなります。
concatenate


| | コメント (0) | トラックバック (0)

2005.11.27

勝手にポジショニング 定年後をどう過ごすか【音声解説付】

フジサンケイ ビジネス アイ 2005/11/19 18面
団塊世代の意識調査 定年後をどう過ごすか

変わる消費市場 博報堂生活総合研究所
4つのベスト10(複数回答)表を合体、ランク外項目は、便宜的に0.01%として双対尺度法を実施。
クリックすると図解が大きくなります。

【結論】夫婦で楽しみたいことは類似がある。自分で楽しみたい事は夫婦で差がある。

fsbi20051119


| | コメント (0) | トラックバック (0)

2005.08.02

快眠のために心がけていることは?

シリーズ:きままに双対尺度法だっけ?あるいは勝手にデータマイニング

フジサンケイ ビジネスアイ 2005/07/31 ランキングランド
快眠のために心がけていることは?を双対尺度法で分析しました。
文中の解析どおり、若い人ほどお金をかけず、中年になるといろいろ工夫をしている様子がわかります

kaimin


| | コメント (0) | トラックバック (0)

2005.07.12

コンビニで購入することが多いもの【かってに散布図】

2005/7/7 フジサンケイ ビジネスアイ コンビに関するアンケートが面白かった。
男女の購入による差が分かりにくかったので、勝手に散布図にしてみた。

続きを読む "コンビニで購入することが多いもの【かってに散布図】"

| | コメント (4) | トラックバック (0)

2005.04.02

暖かくなると...

暖かくなると 夏の海を思い出します。気まぐれで同窓生のwebを検索してしてみました。
キーワードは 水口 オルカ

続きを読む "暖かくなると..."

| | コメント (0) | トラックバック (0)

2005.03.16

わかるかな?コレポン

データ解析手法にコレスポンデンス分析がある。ポジショニングを考える上で有効なツールの一つ。ただ、使う相手とタイミングを考えないと手法の説明に時間をとられたりすると、こっちも旨く説明できないので泥沼に...で、この本は便利かもしれない。

続きを読む "わかるかな?コレポン"

| | コメント (0) | トラックバック (0)

2005.01.01

え、初めてなの..

実は正規表現を使うのは...
Rを使って分析グラフ化をするときにエクセルにデータ移行しようとして、テキストでコピーしてデータ区切りをタブに変更しようとした。データの間には複数の半角空欄があるのでストレートに置換するとタブが入りすぎる。
今までエディター使い倒してきたけど、grepはお世話になってきたけど、検索に正規表現を利用したことが無かった。
必要がなかったので、どうしようもない。ヘルプを見て以下のように処理することにした。

seiki2
「\s」が空欄をあらわしている。さらに連続しているので「+」を追加。 変更するタブも「\t」にして置換を実行すると、うまく文字列がエクセルで処理できるようになった。

本来はRサイドで書き出しの処理が出来るようであるが、時間が必要。今回は正規表現が一つ分かったので、今後応用がききそうなので満足。

seiki

エディタはWZエディタを使用。

| | コメント (0) | トラックバック (0)

2004.12.31

箱ひげでR

ひょっこりひょうたん島は「トラヒゲ」、グラフは箱ひげ。青髭は嫁いらず。
2行入力するだけでグラフが描ける。早い・安い・うまい!日本語表示可。
参考書はこれ。

> AA <-read.csv("I:/Book/Chapter09/hanbai1.csv")
> boxplot(kingaku~syouhin,data=AA,col=c("blue"))

boxplot

| | コメント (1) | トラックバック (0)

2004.12.29

どっちの板にショー【アンケート】-2005/01/05

掲示板のタイプ選びに苦労しています。2つのタイプから選んでください。
目的は掲示板を使って知的生産ツール(パソコンソフト以外も含む)について意見交換することです。
画像の添付の便利さ、スレッド表示の見やすさ両方備えているものがないので、サンプルは両方作ってみました。
2タイプのBBS(掲示板)の機能比較

bbs

サンプルは以下から確認できます
JoyfulNoteタイプ

WebForumタイプ


どちらか選んでください

JoyFul タイプ 画像添付可

WebForumタイプ 発言スレッド表示




結果だけをみる


| | コメント (0) | トラックバック (1)

火曜日はお休み

GoogleAdsenseに登録するとweb広告のパフォーマンスをCVS形式で出力できる。データを使ってアクセスに影響のある要因をエクセルで解析してみた。
【結果】要因が抽出した以外に存在している(多分)あえて言うなら「火曜以外は安定して投稿しましょう。」

要因で影響度が大きいのは曜日だが、火曜日のアクセスが低い

webacces1

元データでも火曜日はアクセス少ないですね。なぜでしょう?
webacces2

調査期間:2004年12月16日~12月28日
分析法:エクセル解析ツール、回帰分析を利用

| | コメント (0) | トラックバック (0)

2004.12.21

Rの学習用web2【JIN'S PAGE】

Rの学習用web2です。こちらは大学の演習用のwebです。
学習予定にしたがって演習もよういしてあり、資料もweb上から入手可能です。
ある程度慣れてきたら、こちらで学習するのも面白いでしょう。

JIN'S PAGE

| | コメント (0) | トラックバック (0)

Rの学習用web1【Rとは - RjpWiki】

Rを学習する環境が整ってきていますが、webの充実ぶりも目を見張ります。こちらは百科事典のようなものです。
ここに来ると調べ物が一応出来ます。

Rとは - RjpWiki

What is R? (R とは?)

| | コメント (0) | トラックバック (0)

2004.12.16

日本語化されていたのでR2

こちらもRを使ったデータ解析の本です。横にRを起動して例題を解きながら読む参考書のようなものです。Rについての取説ではありませんが、学習していけば身について行きそうです。こんな時代に学生だったら統計学が好きになったかもしれない。

 【書 名】工学のためのデータサイエンス入門
      -フリーな統計環境Rを用いたデータ解析-

 【著 者】間瀬茂・神保雅一・鎌倉稔成・金藤浩司
 【発行所】数理工学社
 【発行日】2004/3/25
 【ISBN 】4-901683-12-8
 【価 格】2300円

| | コメント (0) | トラックバック (0)

2004.12.15

日本語化されていたのでR

「フリーの統計ソフトR」-ソフトではなくデータ解析環境-が日本語化されていたのでした。といっても、項目名などに日本語が使えるようになっただけです。それよりも解説環境がいつの間もにか充実していて、こんな書籍が出版されていたのです。

解説が丁寧でCDROM付き、これは便利。


 【書 名】 The R Book データ解析環境Rの活用事例集 
 【著 者】 岡田 昌史
 【発行所】 九天社
 【発行日】 2004/6/1
 【ISBN 】  4-901676-97-0
 【価 格】  3800円

| | コメント (0) | トラックバック (1)

2004.12.12

龍のお休み

041210_213901.jpg東小金井の「龍」は例年正月三賀日も営業しているので予約に行ってみるとお休みで、宴会のシーズンにいきなりお休みしないでといいたい。またくるからな(涙

| | コメント (3) | トラックバック (0)

2004.11.09

顔グラフの書けるソフトデータマイン君の解説が更新

データマイン君-フリーソフト-の解説(例題つき)が更新されました。データ分析のエクセルアドインを利用すると安価にデータマイニングが可能です。

上田データマイニング塾~データマイン君の活用書「データマイン君3分クッキング」ダウンロード開始(2004/09/14)

塾生登録を行うとダウンロードが可能です。


| | コメント (0) | トラックバック (0)

2004.10.22

数量化III類プログラム::池田データメーション研究所

図解 自分のポジショニングの見つけ方で利用する数量化III類のプログラムがエクセルのアドインで安価に販売されています。もっとも統計の専用ソフトはほかにも使えるので、個人によりチョイスはさまざま。選択肢の一つとして。

ソフトリスト

106 Ⅲ類固有値分析プログラム3類固有値101 \2,000.-

| | コメント (0) | トラックバック (0)

2004.03.06

図解 自分のポジショニングのみつけ方

-----------------------------------------------------
 【書 名】図解 自分のポジショニングの見つけ方
 【著 者】宮澤豊
 【発行所】講談社
 【発行日】2004/2/25 
 【ISBN 】4-06-21223-5
 【価 格】1,400円
-----------------------------------------------------
評価は★★★★(5つが最高)
・ネーミングに「図解」とあったので、久恒氏の「図解」の類書と思ったが、内容をみると理論に基づくマーケティングの本でした。
・参考文献を見ると、以前 早稲田エクステンションセンターでオープン講座でマーケティングを受講した柴田正幸氏の著書「競争優位のマーケティング」がクレジットされていたので即買いでした。
・最終ゴールは、ポジショニングを人間関係に応用して組織の中で生き残れ、あるいは仕事をやりやすく進める、ということと理解しました。-なぜ強者だけでは勝てないのか?が問題提起-
・統計(ソフト)に関する記述は、特になく、内容の理解に問題はないが、実践しようとしたとき用にソフトの紹介まどもあれば良かった。-私は、上田太一郎氏の著作などで身近なツールを若干知っていました-
・読書の視点では「どのように実際に利用するか?」が切実に知りたいところですが、印象としては物足りない。4章がそこにあたりますが、もう少しヒントが欲しい気がします。5章・6章で、なぜ強者だけでは勝てないか?を数値で丁寧に再検証して、いますが、4章との流れに、無理が感じられ、もっと強烈なメッセージが欲しかったです。
・ただし、他に類者がなく、著者の勇気には大いに感謝して、まちがいなく買いです。
・出版にあたってはご苦労も多かったようで、著者のWebで本に書いてない裏話も公開されています。

アイコンをクリックすると内容確認・注文が出来ます
Amazon.co.jp アソシエイト


| | コメント (2) | トラックバック (0)

2003.12.14

プチアンケート(電飾版)結果が出ました

プチアンケート 電飾編結果を発表します。ご協力ありがとうございました。
(個人の)電飾に対して
反対3
賛成1
普通3
の結果です。コメントはここからご覧ください

| | コメント (0) | トラックバック (0)

2003.12.10

プチアンケート(電飾版)作成しました

タイトルどおりです、プチアンケート更新しました。投票はこちらからどうぞ

| | コメント (0) | トラックバック (0)

2003.12.07

Excelで学ぶテキストマイニング入門

Excelで学ぶテキストマイニング入門 林 俊克 (著)

価格: ¥2,600


この本のおかげで2003年後半、テキストマイニングの機能をモノにしようと、形態素分析ソフト・外部講習出席などイロイロ勉強させていただきました。今年を代表する本の一冊になると思います。おかげで、いろいろな人ともお知り合いになれました。

アマゾンでこの本の内容を確認
Amazon.co.jp アソシエイト


| | コメント (0) | トラックバック (1)

2003.12.04

データマイン君-顔グラフ他-

上田データマイニング塾~Excelやデータマイニングツールで、”理論より実践”のデータ分析。"

データマイニングにはまり始めたのは、この人のせいかもしれません。どこかで、データ解析の手法に「顔グラフ」というのがあって、いろいろ探しているうちに、ここに行き着きました。

ここからはもう...エクセルは手放せません。


| | コメント (0) | トラックバック (0)

形態素解析 茶筅

ChaSen Home Page

形態素解析システム 茶筌
Excelで学ぶテキストマイニング入門
で登場した日本語を解析するシステム茶筅のページです。ちょっと、練習するとアンケートのFA(フリーアンサー)内での単語の頻度を調べたりできます。そこから、答えらしきものを導くのはまた遠い道なんですが、とりあえず使えます。なぜ茶筅かというのは...ちょっと笑えます。-リンク先に書いてあります-

【注意】
winXPではうまくインストできなかったので、WIN98のマシンフォルダーをコピーして移動するとうまく動いたので、そのまま使っています。

| | コメント (0) | トラックバック (0)