参考リンク関連のバグ処理中。 これが終わったらsmalldat形式を拡張してgetlog検索にも対応できるようにする。 そうすれば大幅に高速化されるはず。(希望的観測) そのあとはサイト横断検索。

ised@glocom

http://ised.glocom.jp/ised/07080514 より以下、高木浩光氏、fjやJava-House ML時代の自分の煽り癖の真相を語る。感慨深いものがありますね。 東浩紀(以下、東): ところで、そろそろ高木さんからも意見を伺いたいのですが。高木浩光(以下、高木): 高…

TODO

わりと面倒なバグがたまってますねぇ。 板によって参考リンクが出たり出なかったりする Remixで参照IDがとれない不具合の修正 Remixのツリーでトピックが表示されない @ふぁの2002年の一部のファイルの解析で無限ループに陥る たまりにたまってくるとやる気…

全文検索実装

GetlogとNamazuによる全文検索との連携を実装しました。 各Getlogの画面の下にある全文検索フォームを利用してください。 (例:http://strangedb.ath.cx/getlog/zanzan/getlog.cgi#namazu) ※簡易検索の「すべて」指定でもできるようにしました。 用途 全文…

TODO

板によって参考リンクが出たり出なかったりする mod_perlのインストールおよび対応 一部過去ログのgzip転送化 mknmzの自動バッチ→対応済 Namazuにおける厳密なAND検索対応(CSV対応フィルタ作成)

過去ログ一覧のソート順

@qwertyで「過去ログ一覧を上から新しい日付順にソートしてほしい」という要望があったのですが、こうしてしまうと、詳細検索フォームを過去ログ一覧の下に設置しているため、詳細検索から新しい順に過去ログをチェックできなくなり、使いにくくなってしま…

くずはすくりぷとの

記事の引用構造に特化した検索処理を考えてみた。 レス投稿は2つ前の記事を引用したものがデフォルトになるので、大半は2つ前の記事がそのまま引用された投稿になっている。これを引用部分を削除した記事と、引用した記事(+孫引用された記事)のIDという…

Search::Namazu

NamazuのPerlモジュールであるところのSearch::Namazuが動かない。コマンドラインでperl.exeを使って実行するとうまくいくのだが、CGIで動かすと検索結果が返ってこない。そして何のエラーも吐かない。どうも以下の辺の環境変数がApacheでは取得できていない…

Namazu vs. Google

NamazuとGoogle Desktopを動かしてそれぞれ9,732ファイル(約14GB)に及ぶ過去ログをfeedさせているわけであるが、ヒット件数の違いに大きな隔たりを感じる。たとえばNamazuでコラーゲンと入れて検索すると156ファイルヒットするのだが、Googleデスクトップ…

更新状況

Remixのトピック検索に対応。 併せて、検索結果から表示方法を変えるリンクなどを実装。 重大なバグ。本店の過去ログ検索なのに黒板色だった。本店だけ青くなるように修正。http://strangedb.ath.cx/getlog/honten/getlog.cgi 0時を越えて日付をまたがったツ…

ディレクトリ閲覧スクリプト

@検索で使ってる汎用ルーチンをちょっと公開します。http://strangedb.ath.cx/www-db/dir_filelist.pl.txt指定したディレクトリのファイルリストを取得するスクリプトです。 File::Findは最下層まで掘り下げてしまうし、readdirは掘り下げができないので、…

アイディアメモ

過去1日〜7日分ぐらいまで対応のサイト横断検索を実装したい。 検索結果から、「この条件で(サイト一覧のプルダウン)を検索する」ボタン。 ログファイル募集→足りないファイルの検出→とりあえず各板の開始日はぁWや各板のカウンタ表示を参考にして設定情報…

レイアウト変更

やはり、詳細検索を過去ログ一覧の下に配置して、過去ログ一覧は新しいファイルが下に来るようにしました。qwertyでその要望があったのと、自分でもそれが使いやすいと思ったので。

リンク

@検索で対応している各板の一部から@検索へリンクしていただきました。ありがとうございます。 いままではリリース用のコードを直接編集してたのですが、さすがに開発環境とリリース環境をわけることにしました。

@検索の重さ改善

以下のようなgetlog形式のトップ画面の表示に今までは数秒間かかっていましたが、 それを改善しました。 http://strangedb.ath.cx/getlog/qwerty/getlog.cgiファイル一覧の部分と、パラメータなしのトップ画面全体をStorableを用いてキャッシュ化しています。…

@qwertyより

投稿者: 投稿日:2005/07/23(土)16時34分56秒 ■ ◆ 木 > @検索の位置が微妙にアレだな(;´Д`) > 今までのクセで読専のつもりで何回も押しちゃうよ @検索使いにくいよ sovキーワードで検索する子なんていないだろうし OPERAだとチェックボックスをクリックで…

芸能証券

http://www.gse.jp/format?s=1001-1050芸能人名のGoogleヒット件数を株価に見立ててチャートなんかを作っている。それなりに時系列の動向が読めて面白い。 こういうネットリサーチ系サービスはガーラを筆頭とした昨今のITベンチャーの流行りのようで、その辺…

タスクでコマンドを10分ごとに実行

タスク(@管理ツール)*1はWindowsで定期実行を行うのに便利であるが、一番短いサイクルは1日に1回だけだと思っていた。しかし、各タスクのプロパティのスケジュール→詳細設定を見ると、「タスクを繰り返し実行」というオプションがある。これを使えば、1日…

Namazuショック

Namazuのインデックス作成(mknmz)に時間がかかりすぎる。 たとえばqwertyの5MBぐらいのHTMLファイルにいたっては、6800秒ほどかかっている。 しかも、以下のようにファイル個別にインデックスを追加しているのだが、うかつに「--no-delete」オプションをは…

最新ログ取得について

最新ログ取得&更新の処理が意外と面倒。必要な処理のステップを記述してみます。こういう場合、フローチャートやシーケンス図も便利ですが、とりあえず日本語で記述してみるのが一番良い気がします。 前回のログ取得時間をチェック。前回のログ取得時間から…

宣伝

とりあえず使い物にはなってきたので、暫定退避とqwertyと本店に宣伝してみたら 他の各板にも宣伝してくれた人がいるみたいです。ありがたい限りです。 これからも機能強化/改善に努めていきたいと思います。 特に最新ログ取得対応*1は急がないといけないで…

TODO

優先度の高いもの Remixのトピックごとの検索対応 最新ログ更新の対応 少量ログの月間化 どれも実装コストが大きいですね。 その他 キーワードsuffix(name:など)対応 検索結果上部表示の改良 表示方法の変更、検索条件の変更など 件数表示の改善 改行つき…

sov退避との連携

@検索とsov退避との連携として、キーワードの横にある出現数の数字をクリックするとすぐに検索できるようにしました。 http://strange.egoism.jp/sovs/この手軽さが目指していたところのひとつです。 共起や固定(投稿者)検索も対応してます。

実装状況

ツリー検索、それなりに実装完了。 http://strangedb.ath.cx/getlog/zanzan/getlog.cgi?m=tree;q=%83e%83%8d;l=20050721i-mirai形式のツリー表示を実装したのですが、なかなか苦労しました。 ツリー構造は再帰処理の典型例ということで、実装するのはなかな…

全角半角を区別しないパターンマッチ

せっかくなのでコーディング的なノウハウも書いてみます。 検索エンジンでは、アルファベットの大文字小文字を標準で同一視するものがほとんどですが、日本語ではあまり意味がありません。 日本語の場合、全角カナと半角カナ、または全角英数字と半角英数字…

それなりに実装できてきました。 http://strangedb.ath.cx/getlog/しかしまだモックアップの部分も多く、大きな実装がいくつか残っています。 i-mirai形式のツリー表示など。 公開にはもうちょっとですね。検索パターンやログの大きさによってはCPU時間を1秒…

こんな感じで作成中です。 http://strangedb.ath.cx/getlog/mockup.html

getlogのUI

getlog形式の検索画面のユーザーインターフェースを考えてみる。 せっかくsov退避の統計情報を作っているので、それも活用したい。 簡易検索 基本的にキーワードを入れるだけですばやく検索できるようにする。 futurelogのクイック検索と、i-miraiの過去ログ…

namazuだけではあまり使えないことが薄々わかってはいたが、やはり実装してみると実感がわいてくるものだ。 Kuzuha.pmのKuzuha::Getlogのソースコードを移植して、futurelogに近い形式の検索を実装中である。また、HTMLのtitleタグが統一されてなかったので…

i-mirai

i-miraiの右上にある検索が非常にすばらしいということに気づく。 http://i-mirai.dyndns.org:8007/cgi-bin/bbs.cgiきわめて高速にキーワード検索を行うことができ、検索結果がツリー形式で表示される。 しかもメイン級の板複数を対象にして横断的に検索でき…