2014年06月20日

GAE で lxml を使用する方法

Google App Engine で HTML の parse をしたい場合、lxml が使用できます。 GAE で使えるThird-party Libraries はこちらを参照。

lxml を使用するためには、app.yaml に
libraries:
- name: webapp2
  version: latest
- name: jinja2
  version: latest
- name: lxml
  version: latest
という記述を行う必要があります。こうしておけば、
import lxml.html;

dom = lxml.html.fromstring(content);
という感じで使用できます。

ただし、このままではローカル環境(dev_appserver)で No module named lxmlというようなエラーが表示され、うまく動きません。
ローカル環境では自分で lxml を install する必要があります。
pip を install していない場合は、まず、pip を install してから lxml を install するという手順をふむ必要があります。
$ sudo easy_install pip
$ sudo pip install lxml
ラベル:GAE
posted by おちエン at 02:08| Comment(0) | 開発 | このブログの読者になる | 更新情報をチェックする

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。