June 28, 2009

自分の持っているサイトで、select要素のonChangeで別ページに遷移する仕組みを取っています。 実際にモノ [orelabo.jp]を見ていただいたほうが話は早いのですが、 複数のselect要素を用意してさまざまな組み合わせを自由に選べるようにしています。

このページにGoogleBotがやってきたのですが、この組み合わせを全部試していってくれました。 毎日数千アクセスがあり、それが何日も続きました。 組み合わせを変更しながら試していた様子はアクセスログで確認しました。

よって、GoogleBotはdocument.writeのような簡単なスクリプトだけでなく、さまざまなJSを解釈し、 実行していると認識しています。

ちなみに、Yahooなどのクローラではそのような挙動をしていませんでした。

June 27, 2009

OS3.0でタンブラー系のアプリが死亡してるのとか見て思ったんだけど、スクレイピング系のアプリはスクレイピングパートを自前のサーバーに置いて、そこを経由するほうがいいのかなぁと思った。

スクレイピングのアルゴリズムをアプリの中にハードコードしてしまうと、HTMLの仕様が変わってしまったときに、迅速な対応ができない。修正版をAppleに提出しても1〜2週間かかってしまい、その間アプリは動くなってしまうので。

あとはそういうロジック部分をサーバに出しとくと、iPhone, Android, BlackBerryとかでクロスなアプリを作りやすいし、危機対応もしやすいのかなぁと思う。

fladdict » スクレイピングはサーバー処理が安全かなぁ

内部実装の話なので特に外に向けてアピールするつもりはなかったのですが、tumblr gear r.1.2.0 でまさにその実装をしていたところなので、ちょっとびっくりしました。
fladdictさんの指摘と違うことをやろうとしているのは、スクレイピングの処理自体をサーバー側に乗せてしまうとスケールしないと思ったので、スクレイピングのエンジンをクライアント側に持ち、クライアントはメタデータをサーバー側から取ってきてスクレイピングする、という実装にしているところ。
すでにスクレイピング処理に使うメタデータのほとんどはサーバー側に配置できているのですが、もっと処理の抽象化やパラメーター化が必要だなあと思っています。
という実験中。

(via honishi) (via yaruo) (via gkojax) (via polog)

iviewも元々スクレイピングのためのメタデータ共有をしたい、というところから始まったもののひとつなのでスクレイプのルールは外から持ってきて実行を中でやろうと思っていましたがiPhone SDK Agreementをよく読んでたら3.3.2に

An Application may not itself install or launch other executable code by any means, including without limitation through the use of a plug-in architecture, calling other frameworks, other APIs or otherwise. No interpreted code may be downloaded or used in an Application except for code that is interpreted and run by Apple’s Documented APIs and built-in interpreter(s).

というのがあって、もともと組み込まれているインタプリタを除いて、ダウンロードしたコードを解釈し実行するこことがNGだって書いてあるのを見つけてApple的にFlashがNGなのと同じ古い理由でweb2.0/radical trustがspoilされて本当にむかつくけどとりあえずレビュー通らなかったら作っただけむだになるのでひよってやめました。

どうせならそのメタデータの仕様とデータを公開/共有しませんか。誰かがメンテしてくれるようになりますよ。

(via ku)

OpenID陣営の本格的な取り込みなど課題も残るカンターラだが、注目すべきは日本の果たす役割だ。

 もともとアイデンティティ管理技術の規格は対立的な構図として存在し、各陣営の関係者が互いに話をするようなこともなかったという。ところが日本は例外だった。NTT情報流通プラットフォーム研究所の高橋氏は、「日本はユニーク。関係者がみんな近い立場で活動をしている。これは世界的にも驚かれている」と話す。もともと対立していた各陣営が日本では横につながっていた。それが世界的組織へと波及的に発展したのがカンターラだ。

アイデンティティ・ベン図に登場する主要団体が賛同しているように見えて、現時点ではOpenIDファウンデーションが入っていない。個別メンバーで見ればカンターラにもOpenID関係者は多いが、団体としてのOpenIDファウンデーションは、カンターラ発足時に参加する案を見送った。この点について、崎村氏は微妙な文化のすれ違いを指摘する。

 カンターラの母体となっているのはリバティ・アライアンスで、これはIT関連の中でも“エンタープライズベンダ”と呼ばれるような、いわば「堅い」企業が会員となっている。発足時に約20ある分科会を見ても、政府やテレコムなど堅そうな題目も目に付く。こうしたエンタープライズ系の企業カルチャーに対して、「草の根」の活動を自認しているOpenIDコミュニティの一部のメンバーが脅威を感じているのだという。

 権利関連の法的処理や、経験を積んだ組織運営のプロなど、こうした“エンタープライズ系ベンダ”の企業には、むしろ利用すべきリソースが多い。しかし、そういう崎村氏の説得にも、OpenIDのメンバーの一部が拒否反応を示したという。そこには「理屈ではない、何か心理的な抵抗感があるのではないか」(崎村氏)という。

June 26, 2009

# Key Characteristics of a Winning SaaS Team

* CEO – Visionary, but disciplined

* CFO – Disciplined, and flexible

* CMO – Thought-leader, but focused

* CTO – Knowledgeable, yet practical

* VP, Sales – Persistent, and creative

* Product Development – Agile, and service-oriented

* Sales – Service-oriented, not product-centric

* Support – Business-oriented, not technical

June 25, 2009

OS3.0でタンブラー系のアプリが死亡してるのとか見て思ったんだけど、スクレイピング系のアプリはスクレイピングパートを自前のサーバーに置いて、そこを経由するほうがいいのかなぁと思った。

スクレイピングのアルゴリズムをアプリの中にハードコードしてしまうと、HTMLの仕様が変わってしまったときに、迅速な対応ができない。修正版をAppleに提出しても1〜2週間かかってしまい、その間アプリは動くなってしまうので。

あとはそういうロジック部分をサーバに出しとくと、iPhone, Android, BlackBerryとかでクロスなアプリを作りやすいし、危機対応もしやすいのかなぁと思う。

fladdict » スクレイピングはサーバー処理が安全かなぁ

内部実装の話なので特に外に向けてアピールするつもりはなかったのですが、tumblr gear r.1.2.0 でまさにその実装をしていたところなので、ちょっとびっくりしました。
fladdictさんの指摘と違うことをやろうとしているのは、スクレイピングの処理自体をサーバー側に乗せてしまうとスケールしないと思ったので、スクレイピングのエンジンをクライアント側に持ち、クライアントはメタデータをサーバー側から取ってきてスクレイピングする、という実装にしているところ。
すでにスクレイピング処理に使うメタデータのほとんどはサーバー側に配置できているのですが、もっと処理の抽象化やパラメーター化が必要だなあと思っています。
という実験中。

(via honishi)
June 24, 2009
なお、カンターラ・イニシアティブの発足に伴い、SAMLを推進していたリバティ・アライアンスとリバティ・アライアンスが主導していたオープンリバティ、コンコーディア・プロジェクトは解散。カンターラ・イニシアティブの一部門として吸収される。
June 23, 2009
# The network is reliable/ネットワークは信頼性がある*2
# Latency is zero/遅延はゼロである*3
# Bandwidth is infinite/帯域は無限である
# The network is secure/ネットワークは安全である
# Topology doesn’t change/トポロジーは変更されない
# There is one administrator/管理者は一人である
# Transport cost is zero/送信コストはゼロである
# The network is homogeneous/ネットワークは均質である

INRIA大で開発されたHopは、「Web2.0のためのプログラミング言語」です。

例えば、”現在の日付を返すWebサービス”へのAjaxを、以下のように記述できます。

(define-service (server-date)
(current-date))

(<HTML>
(<BUTTON>
:onclick ~(with-hop ($server-date) (lambda (h) (alert h)))
“Server time”))

つまり、Webページリクエストを、クロージャの関数適用のように扱える言語です。

June 20, 2009

元IBMのS氏は、「H/Wベンダー、S/Wベンダーそして色々な思惑のある連中が共通する利益追求目的で唱えたのがプライベート・クラウドでしょう」と言い切る。

 BlueWorksの発表も、結局は高価なソフトウェアを購入してもらうためのBaitでしか有り得ないわけですが、OSSで広がった安価なソフトウェア(でも大丈夫なんだという)の現実は、クラウドの登場によって、ハードもソフトも買わなくていいんだという、さらに過激な世界が、ユーザーに受け入れられていくというインパクトです。
 ミドルウェア・ベンダーのビジネス・モデルは、高機能なミドルを開発し、高価な値付けで売って開発費を回収し、利益も出すというものですが、そのライセンス販売の仕組みに大きな影響を与えていくのがAmazonであり、Googleです。この二つを、AmazonやGoogleはIntegrateして、別の解決策があるよ、と示したわけです。