2014年06月20日

GAE で lxml を使用する方法

Google App Engine で HTML の parse をしたい場合、lxml が使用できます。 GAE で使えるThird-party Libraries はこちらを参照。

lxml を使用するためには、app.yaml に
libraries:
- name: webapp2
  version: latest
- name: jinja2
  version: latest
- name: lxml
  version: latest
という記述を行う必要があります。こうしておけば、
import lxml.html;

dom = lxml.html.fromstring(content);
という感じで使用できます。

ただし、このままではローカル環境(dev_appserver)で No module named lxmlというようなエラーが表示され、うまく動きません。
ローカル環境では自分で lxml を install する必要があります。
pip を install していない場合は、まず、pip を install してから lxml を install するという手順をふむ必要があります。
$ sudo easy_install pip
$ sudo pip install lxml
ラベル:GAE
posted by おちエン at 02:08| Comment(0) | 開発 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

×

この広告は1年以上新しい記事の投稿がないブログに表示されております。