タグ

2007年11月1日のブックマーク (7件)

  • はてなブックマークの傾向(2)

    前回の記事ではカテゴリの分布とタグ毎の仕様ユーザー数を出してみたのだが、データ収集に当たっては考えなしに他にも色々データを取っていたりする。なのでまだ同じネタで引っ張れるかなーなどとよこしまなことを考えてみた。今回は前回からもう一歩踏み込んで、タグとカテゴリの関係についてのデータを紹介してみることにしたい。 なお、データには前回使用と同じく12月20日時点におけるものを使用している。タグに関しては前回も書いたとおり、エントリ毎の詳細ページを見てみなければわからない。詳細データについては上位100エントリ分しか取得していないので、今回の対象はそこまでということでご了承いただきたい。 まずは基的なデータから。上位100エントリにおけるカテゴリの分布は以下の通り。 カテゴリ 件数 ウェブ 42 コンピュータ 25 一般 20 はてな 8 2 ゲーム 1 サイエンス 1 マンガ 1 IT系が

  • 平均と偏差、分散、相関

    調査とか測定を行って得たデータの集まりがあったとき、その集団の構造を端的に表現してしている代表的な言葉が平均値と偏差値です。 偏差値の出し方はともかくとして、平均値の出し方ぐらいはご存じだと思いますが、その概念的なものはどうでしょう。また、偏差値もよく聞く言葉ですが、何かモヤモヤした感じを抱いていませんか?これらはデータの集まりである集団構造を一言で表せる言葉ですので、統計にはよく用いられます。 ここでは、平均値・偏差値・分散及び相関などの概念について説明します。 【平均】 平均値を求めるには、データを全て加え総個数で割る事で求めていますが、このやり方は算術平均と呼ばれています。平均にはこの他に幾何平均、調和平均がありますが、これらは特殊なもので、通常特に断りが無ければ平均と言えば算術平均の事を指しています。 幾何平均は比率の平均を出したいとき、対数正規分布の中心を求めるとき、人口の増加率

  • 標準偏差を求めるperl関数 - *「ふっかつのじゅもんがちがいます。」withぬこ

    標準偏差っていうのが何なのか、最近知りました。 標準偏差 - Wikipedia こういう数式で表されます。 ていうか、僕こういう数式にすごく抵抗あるんですよねぇ。 プログラムの方が理解しやすいかも。 これを見て、そういえばBuzzurlのタグクラウドを作るのに、標準偏差を基に重み付けをしたなあと思ってソースを見たら汚かったので書き直してみた。 普通に書くとこう。 #分散を求める。標準偏差が欲しい場合は戻り値をsqrt() #average関数は自明なので省略 sub variance { my $num = scalar(@_) or return 0; my $ave = average(@_); my $ret = 0; while(@_){ my $i = shift; $ret += ($i-$ave)**2; } return $ret/$num; } まあこれでいいんだけど長

    標準偏差を求めるperl関数 - *「ふっかつのじゅもんがちがいます。」withぬこ
  • タグクラウドを作ってみた

    わんくまでは珍しいJavaを中心とした日記です 目次 ホーム 連絡をする RSS Login Blog 利用状況 投稿数 - 218 記事 - 0 コメント - 15135 トラックバック - 28 書庫 2008年7月 (1) 2008年2月 (2) 2008年1月 (10) 2007年12月 (9) 2007年11月 (5) 2007年10月 (27) 2007年9月 (25) 2007年8月 (27) 2007年7月 (29) 2007年6月 (15) 2007年5月 (23) 2007年4月 (37) 2007年3月 (8) 日記カテゴリ Java (rss) JavaScript (rss) SQL (rss) WEB (rss) その他 (rss) いろいろリンク The Herringroe Projects(Javaで色々) わんくまトップ 古い方のブログ 最近はあんまりブ

  • Buzzurl [バザール] / ソーシャルブックマーク

  • 「セマンティック・ウェブ」アプリケーション『Twine』が始動 | WIRED VISION

    「セマンティック・ウェブ」アプリケーション『Twine』が始動 2007年10月22日 IT コメント: トラックバック (0) Julie Sloane 2007年10月22日 サンフランシスコにある新興企業米Radar Networks社はこの6年間、セマンティック[意味論的]・ウェブ初の重要な一般向けアプリケーション『Twine』を世に送り出そうと開発を進めてきた。 10月19日(米国時間)の『Web 2.0 Summit』で、Nova Spivack最高経営者(CEO)がプロジェクト『Twine』の詳細を初めて公にするが、Spivack CEOは、公開前のTwineをワイアード・ニュースに見せてくれた[英語版記事の掲載は10月18日]。 Spivack CEOは、1998年に米EarthWeb社を立ち上げ、株式を公開した1人でもある。このプロジェクトは、Paul Allen氏が設立

  • http://pr.jst.go.jp/jdream2/