NORA

雑食気味なひよっこプログラミング記録

2013-01-01から1年間の記事一覧

3日目

Java学習3日目でござい。LLと違って型を強制されることで注意すべきことが色々と出てきました。今日はそこの所に注目して学習記録を取る形になったのかな。本日は次の4項目について学びました。 Stringクラスを使った文字列処理 メソッドの利用 mainメソッ…

今日の知識詰め込み

今日も今日とてJavaをコツコツと学習してきました。どこまでやったのか、次の通り。 繰り返し処理 条件分岐 処理の流れを制御 配列 そして上記の中で気になった所などを書き出しておこう、そうしよう。 foreach文:for(データ型 変数名:コレクション){...} s…

今日やったことー。

今日は以下の部分を学習しました。とはいえ、他の言語を少しは知る身ではあるのでサクサク進めていきました。 Javaソースファイルのエンコーディング 文字列と数値 変数とデータ型 演算子 繰り返し処理 この中で気になった部分をメモっておきます。 static …

今日はsublime text でjavaを始めた日。

唐突にJavaの勉強が始まった。何故だ? sublime text を今までシェアウェアだと勘違いして指くわえていた所、無料でも使えることを知ってちょっと使ってみた。Javaの勉強を始めたこともありありがたい先人の知恵を参考にJavaの環境を整えてみましたー。 Java…

今日やったこと。

はてなブログからフィードを取得し、形態素解析してデータを作り、クラスターを作成するまでは完了した。 けれども、ネストが非常に深いPythonの辞書を作成する方法が分からず詰まった。 class bicluster: def __init__(self, vec, left=None, right=None, d…

今日やれなかったこと。

集合知プログラミングのデンドログラム表示をPILで行うように書いてあったが、d3でやってみよう!と調子にのったところ超難航。 DOMをいじくり回すのだから、directiveを勉強すればいいのか?という適当なアタリを付けて、http://egghead.io/lessonsを見てみ…

ブログ100件集めるのは大変だと思います。

集合知プログラミングの第3章においてブログを100件用意して、各ブログのフィードから単語の出現頻度を測定。 結果からどのブログがどれだけ似ているかなー?と量る部分に入りました。 chromeのはてな拡張を入れて、Googleで site:hatenablog.com プログラミ…

今日やったこと。

今日はRSSやATOMといったフィードから単語のリストを取り出す部分を書いた。といっても本書では英単語を対象にしたものだったので巻末付録にもあったBeautifulSoupを用いた日本語向けのコードに変更。その際にBeautifulSoupのドキュメントを読んでいて気にな…

詰まったら切り上げて先に進む。

タグとアイテムのデータセットを作る箇所で随分とつまづいてしまった。どうにかはてなブックマークの人気エントリーからデータセットを作ることは出来たが、勉強が先に進まずに気持ちがだれてくることを感じた。なので、ここで一度2章末問題を切り上げて3章…

今日やったこと

「タグとアイテムのデータセットを作りなさい。」 このように言われて2章で書かれていたユーザーからブックマークを集める方法をよく考えもせず行っていた結果、アイテム数が万を超えて間違いに気づく。万を超える数のアイテムについてAPIでリクエストした…

今日やったこと

XMLを解析にかけていると思っていたら、いつの間にかHTMLを解析に掛けていた。 GAEの開発サーバーでurllib2でリクエストを行ったらめっちゃ怒られたのでurlfetchに書き換えてリクエストを行ったところ、パラメータの設定をミスっていた。 そのため&mode=rss…

今日やったこと。

集合知プログラミングの2.10.2 タグの類似性 に取り組もうとしてdeliciousではなく、はてなのデータセットでやろうと考えました。なのではてなのAPIからデータを取得して、タグとアイテム(URL)のデータセットを作るコードを書いていました。 単にアルゴリ…

Tanimoto係数ってなにさ?

集合知プログラミングの2.9まで終了。そして2.10エクササイズの1つ目・・・ Jaccard係数のほぼ同意語(類似性の定義は同じだが、距離の定義が異なる)であり、集合間類似性スコアを算出するもの。らしいです。算出方法は次の通り。 sim(Ci, Cj) = 部分集合 …

問題がいっぱい。

今日は問題がいろいろと起きた。 GAEで推薦行うプログラムを動かそうかなーと考えていたら、 最近はてブ数500オーバーした記事(記事数は5つ)をはてブしたはてなユーザー一覧を取得する。 一覧のユーザーがはてブしたリンクを取得する。 ユーザー一覧&リン…

今日やったこと。

今日ははてなブックマークから特定のタグで人気のあるブックマークを取得してきて、 そのブックマークをはてブしたユーザーの一覧を取得する部分を書きました。 deliciousのAPIが使えるってわかったけれども、その勘違いが解消されるまでにはてなブックマー…

GAEのdevサーバーにlxmlがなかった。

どうやらバージョン1.8.4の頃から含まれてない様子。 どうしたらええんや!って思ったが無難にpipでインストー・・・またvcvarsall.batが無くて失敗した!!! なんでUnofficial Windows Binaries for Python Extension Packagesのインストーラ使わせて頂き…

今日も自分はせっかちだった。

集合知プログラミングを読み進めていたらdeliciousのAPIをつかう場面がでてきた。 それでAPIを見てみると2010年で更新終わってたもので、てっきり使えなくなってるもんとばかり思い込む。 その後、調べるとこのAPI使ってた人がおり使えることが判明。 ほんと…

2013/10/21

集合知プログラミングの2.4までを読了。 ユーザー、アイテム、スコアデータから推薦を行う方法についてでした。 コードをベタベタ貼るだけってのも芸がない気がして、どう掛けば良いのやら。

今週やったこと

2013/10/19 今日は環境構築をしました。 集合知プログラミングを勉強しようとして、同時にGAE,AngularJSの習熟も出来たら良いじゃないか?と思い立った。 GAE開発サーバーにてAngular-seedを動かすところまで完了。 #

GoogleAppEngineを始めます。

GAEのプロジェクト作成 GAE Launcher使うなりして、プロジェクト作成して下さい。 Djangoのプロジェクト作成 cd GAEインストール先\google_appengine\lib\django-1.5\django\bin python django-admin.py startproject プロジェクト名 これでbinフォルダにプ…