"遊び心",1298,1288,60,"名詞","一般名詞","人名","名","*","*","あそびごころ","アソビゴコロ","アソビゴコロ"
コンパイルする。作成したcsvファイルがあるディレクトリ上で実行。
/usr/local/libexec/mecab/mecab-dict-index -d/usr/local/lib/mecab/dic/ipadic -u bann.dic -f utf-8 -t utf-8 bann.csv
してください。
辞書ベースファイル(csv)を作成する。(作成方法)
apt-get install python-dev
/usr/local/etc/mecabrcにコンパイルしたhoge.dicファイルのパスを追加する。
; userdic = /home/foo/bar/user.dic
userdic = /home/hoge/Download/textsearch_ja-8.4.2/userdict/hoge.dic
参考サイト
Unicode, UTF-8
基本は
# -*- coding: utf-8 -*-でエンコード宣言しているとすると
str型(utf-8)->unicode (unicode, decode)
unicode->utf-8 (encode)
を使います。
現在どのタイプかを調べるには
str = type()
で調べます。
あとタイプによっても長さは以下のように変わるようです。
# EUC-JPなソースコードでは
>>> len("あ")
2
# UTF-8なソースコードでは
>>> len("あ")
3
# unicode型なら
>>> len(u"あ")
1
参考サイト:
Mod-wsgiのインストール
synapticパッケージマネージャーからmod-wsgiをインストール
mod-wsgi.loadを編集
$ sudo vim /etc/apache2/mods-available/mod-wsgi.load
LoadModule wsgi_module /usr/lib/apache2/modules/mod_wsgi.so (追加)
$ sudo a2enmod mod-wsgi
Enabling module mod-wsgi.
Run '/etc/init.d/apache2 restart' to activate new configuration!
$ sudo /etc/init.d/apache2 restart
/etc/apache2/sites-availableの編集
sudo vim /etc/apache2/sites-available/default
参考サイト
Django How to use Django with Apache and mod-wsgi
日付操作
logging方法
python2.6.5ドキュメントダウンロード->(ココ)
Ubuntu9.10へインストール
Python最新版をココから取得する
tar xvzf Python-2.5.5.tgz
cd Python-2.5.5
./configure
make
make install
あと、新しく/usr/local/binにPATHを通す。
vim ~/.profile
で
export PATH="$PATH":/usr/local/bin
を追加する。
シェルを再起動する。
source ~/.bashrc
version確認
#python -V
Python 2.5.5
日本語をサポートしたいのでココからJapaneseCodecsダウンロード!
tar zxvf JapaneseCodecs-1.4.11.tar.gz
cd JapaneseCodecs-1.4.11
python setup.py install
email address 正規表現
ソースコード
import re
def set_email(self, email):
if '' == email:
self.email = '0'
else:
#extract format
mailsrch = re.compile(r'[\w\-][\w\-\.]+@[\w\-][\w\-\.]+[a-zA-Z]{1,4}')
ret = mailsrch.match(email)
if None == ret:
logging.warning('extracted emal error')
return False
self.email = email
return True
参考サイト:extract email address
文字列から辞書へ変換
#文字列をリストに変換する。
lists = [t.split('\",') for t in u_data.split('},')]
#リストを辞書へ変換する。
dict_a.extend(list)
html parser
参考サイト:html parser reference site
urllibの使い方
参考サイト:python2.6公式サイト、
xml parser
参考サイト:Yahoo Weather API、
XML parser change to japanense patch、