刺身の上にたんぽぽ乗せる日記

プログラミングしたり、自販機の下に落ちてる小銭を集めたりしてます

debitカード到着

us

citibankからdebitカードが到着した。言われた通り1週間で届いたので、若干意外。 アクティベーションはATMに挿すか、電話と書いてあり、夜中だったから電話した。 自動応答でdebitカードの番号を聞いてきて、ssnを持っていない場合はそれで終了。持ってる場…

海外送金

us

日本のcitibankからの海外送金が無事終了。大体1,2営業日でできているなぁ、という感じ。 なんだかんだで、まだ家で足りないものがあるし、月末は家賃やらの支払があるから、多めに口座に入れておいたほうが安心な気がする。

Costco

us

会員になった。 入会費$55*1でゴールドメンバーで、さらに$55のデポジットを入れるとエグゼクティブメンバーになれて、2%のキャッシュバックとクーポンがもらえるよ、と言われたけど、2%のキャッシュバックの条件が厳しそうで、デポジットを取り返しに行くの…

ニジヤ・ミツワ

us

bay areaの日本食のスーパーマーケット。昔住んでた東海岸にあった日本食のスーパーとは比べ物にならないほどでかい。多分10倍くらいでかい。 日本のスーパーにあるものは大抵見つかって、納豆の種類と在庫が豊富で驚いた。 アメリカにあるのか?と心配して…

Social Security Number

us

朝からチャイナタウンにあるSocial Security Administration Officeへ。自分のSSNはあるので、妻の分だけ。 ちなみに、SSNは入国から5-10日くらい経たないと、入国したという情報がDBに登録されないらしいので、あんまり早く行くとだめらしいんだけど、とり…

クレジットカードだめだった

us

クレジットカードについて、ある電話番号にかけて、色々追加情報を登録してくれ、と言われたけど、 名前 住所 電話番号 秘密の質問 くらいしかきかれなかった。 で、しばらく待って、と言われて、3分くらい経って、クレジットヒストリーがないから、クレジ…

comcastでインターネット

us

インターネットのセットアップが終わった。 http://www.speedtest.net/result/2246559661.png 20Mbpsの契約して、実際は上り6.5Mbps、下り1Mbps。期待してたより全然マシで安心した。

アメリカなう

us

昨日アメリカについた。 今までGoogle+に色々書いてたけど、もしかしたら今後アメリカに行く人に役立つかも、と思ったので、ブログのほうに書いて見る。

銀行口座とクレジットカード

us

今朝アパートのバスタブが禿げてるところの修繕する人がきて、なんか色々スプレーするから出て行け、と言われたので、せっかくだから空き時間を使って、銀行口座を作ることにした。 以前はクレジットカードを気軽に作れるらしいWells Fargoにしようと思って…

L1Bビザ取りにアメリカ大使館行ってきた

色々と全体像がわからなくて、不安だったので、ひと通りのプロセスを書いてみる。 普通のL1は糞大変らしいけど、ブランケットビザだったせいか、想像よりスムーズだった。 まだ届いてはいないけど、承認はされたから、一段落。 Form I-129とForm I-797 ここ…

I can haz a new blog

LOL

クローラの高速化

新しいサーバでも相変わらずクローラが超cpu boundなため、高速化のために手を打つ。pypy使おうと思ったけど、面倒くさすぎて諦めた。 とりあえず気軽に使えるcythonに切り替え。特別なsyntaxは全く使わず、ただコンパイルしてみたけど、大きな変化はなし。…

Cloud Core

2chnavi引越し予定地。さよならlinode。こんにちはCloud Core。http://www.cloudcore.jp/vps/設定手順 コントロールパネルからログインする OSインストールのページからdebianを選択 リモートコンソールからVNCでつなぐ セットアップの手続きをすすめる DHCP…

solr+gosenで日本語形態素解析

面倒くさい。 http://code.google.com/p/lucene-gosen/でnaist-chasen版のdl solrの3.1使ってたけど、3.5/4.0と書いてあったので、3.5をDL lucene-gosenのjarをexample/solr/libに置く。libディレクトリはないから自分で作る。 schema.xmlを編集。 適当に見…

2011ポーカーを振り返って

まとめとかしてなかったから多少書いてみる。 さよならアメリカ人 主要ポーカーサイトからアメリカ人が消えてしまったせいで、ただでさえ少ないFLテーブル数が激減。今は亡きRushに至っては頭数が揃わないという事態に。 全体的なプレーヤーの強さは雑魚のア…

Party Poker 4NL感想

Party Pokerで何故か親切にもレーキバックが送られてきたので、帰ってきてStarsでStellar AwardとってからはPartyでプレイしてた。FLのテーブルがほとんどない上、Partyで使えるHUDがないから4NLでプレイしてた。 FLに転向するきっかけがStarsの5NLの酷い結…

続・最近の話題抽出

適当にクラスタリングしてみたらこんな感じになった。 ハ 8 ヤバイ 8 ソフトバンク 8 部分 9 ゆき 9 ドイツ 12 小林 15 完全 17 アメリカン, 航空 22 プラス, NEW, ラブ 28 民団, 外国, 異論 32 白, 旭, ヤクザ, ゴルフ 33 お前, 社長, 社員 39 バス, 地下鉄…

最近の話題抽出

とりあえずクラスタリングは置いといて、単純に最近の話題の抽出を行ってみた。 方法は単純に最新1000件とその前の1000件で出てくる単語の比較。 8 栄子 名詞,固有名詞,人名,名,*,*,栄子,エイコ,エイコ 8 ヤクザ 名詞,一般,*,*,*,*,ヤクザ,ヤクザ,ヤクザ 8 …

solr TermsComponent

Apache solrの本を立ち読みしてたら丁度必要っぽいのがあった。 http://wiki.apache.org/solr/TermsComponent これで単語の出現頻度がわかるわけだけど、残念ながらコーパス全体にかけるだけだから、最近のデータだけ、とかはできない。 もうこれは自力でmec…

Pythonでクラスタリング

http://pypi.python.org/pypi/cluster/1.1.0b1これかなぁ。 とりあえずk-means法で適当にクラスタリングしてみたけど、結構時間がかかる。 適当に400次元空間とか遅すぎる。追記: 記事タイトルを形態素解析して、全抽出した単語から、出現頻度が一定以上の…

ブログ記事タイトルの形態素解析

適当にやった。名詞だけを抽出して何かしら面白い結果が得られるか見てみた。 データセットは最近の3000件。 ロシア 33 メンバー 34 夫 34 www 34 体調 35 ー 37 スライム 37 声 39 Part 39 iPhone 39 話題 40 フジテレビ 43 五輪 44 人気 44 声優 46 ピ…

mac + cmecab-javaの1.7

ファイルとかはここ。http://code.google.com/p/cmecab-java/ http://code.google.com/p/cmecab-java/wiki/HowToInstall http://kazuakey.blogspot.com/2010/12/solr-14-cmecab-java.html http://code.google.com/p/cmecab-java/wiki/HowToUse 辺りを参考に…

anちゃん 1.2.69リリース

板長押しで選択される板がずれているバグの修正 1.2.68はリリースし忘れてたけど、配色の選択時にキャンセルするとフリーズするバグの修正。

solrデータ削減計測

とりあえず今日一日のデータで比較。 実行中にデータが増えてるかもしんないから、多少のずれはあるかも。一番期待していたomitTermFreqAndPositionsはやはり想像通り日本語検索がまともに動かなくなる。普通に考えるとどうせデフォルトはn-gramだろうから、…

2chnaviを動かしてるlinodeのリサイズ

ディスクを使いきって、2日間全くアップデートされてなかった。意外と気づかないもんだ。 多分solrのindexを作りなおせば時間稼ぎができたとは思ったけど、時間の問題だろうから、もう諦めてlinodeの大きいプランに切り替えることにした。 そもそも512MBで動…

solr最適化

あんまり見てなかったので。 http://wiki.apache.org/solr/SolrPerformanceFactors http://wiki.apache.org/lucene-java/ImproveSearchingSpeed http://wiki.apache.org/solr/SolrCaching バージョン上げる update頻度が高いので、optimizeではなく、mergeFa…

solr最適化その2

solrだけでなく、周りからの最適化の話。 MySQLとsolrの両方にデータを入れるという構成がそもそも無駄 rawデータとしてmysqlに突っ込んでおくとバックアップが楽だし、solrのschemaを好き勝手に変えられるのは嬉しい。 けどsolrのindexはでかすぎ。 MySQLが…

AndroidでScalaを使う

というか、使えない。酷く時間がかかったけど、ようやくできた。ネットを調べてると、色々なアプローチが書いてあるんだけど、antの使い方わからないし、おぼえるの面倒だからeclipseだけでできる方法で頑張ってみたんだが、うまくいかん。とりあえず、http:…

株式会社エクスプレッソの名誉のために何が起きたかちゃんと書いてみる

http://d.hatena.ne.jp/kudzu/20090711/1247278363 では誤解があったようなので、ちゃんと何が起きたかを書いてみる。 宿ろいどというAndroid用ソフトの開発者がエクスプレッソ社のお宿ナビが宿ろいどをベースに作られていることを発見 http://blog1.ngsdev.…

株式会社エクスプレッソから名誉毀損のための削除申立がきたよ

名誉毀損だそうです。