BioPythonのインストール
塩基配列のBLAST検索などのためのPythonスクリプトを少し書くようになった.生物系というかbioinformatics系ののスクリプティングではBioPerlが有名だが,BioPythonとかBioRubyとかBioCamlとかもある.ネーミングや位置づけはそれぞれ似てるが,とくに統一した仕様があるわけではないようで,規模もさまざまだ(たぶんBioPerlが一番でかい).

Linux(debian etch)でのBioPythonの導入
% apt-cache search biopy
で出てくるパッケージを導入すればよい.

Windows XPでのBioPythonの導入
http://biopython.org/DIST/docs/install/Installation.html
に書いてあるのを以下に簡潔にまとめる.なお実際に動作させているPython 2.4系列用のリンクを示す.Python 2.5系列では試していない.

1. Pythonの導入
http://www.python.org/download/
から
Python 2.4.4 Windows (x86) installer
をダウンロードし,実行する.

2. mxTextTools (文字列操作用モジュール) のインストール
http://www.egenix.com/files/python/eGenix-mx-Extensions.html#Download-mxBASE
から
http://www.egenix.com/files/python/egenix-mx-base-2.0.6.win32-py2.4.exe
をダウンロードし,実行.

3. Numerical Python (数値計算モジュール) のインストール
http://sourceforge.net/project/showfiles.php?group_id=1369&package_id=1351
から
http://jaist.dl.sourceforge.net/sourceforge/numpy/Numeric-24.2.win32-py2.4.exe
をダウンロードし,実行.
"Numeric Python"は"numpy"に名前が変わり
http://sourceforge.net/project/showfiles.php?group_id=1369&package_id=175103
から入手可能だが,biopython & Windowsと組み合わせてテストしていない.

4. ReportLab (PDF生成モジュール) のインストール (必須ではない)
http://www.reportlab.org/downloads.html
から
http://www.reportlab.org/ftp/ReportLab_2_0.zip
をダウンロードし,展開.
生成した reportlab フォルダを C:\Python24\Lib\site-packages\ にコピー.つまりC:\Python24\Lib\site-packages\reportlab\... となるようにする.

5. BioPython (生物学用モジュール) のインストール
http://biopython.org/wiki/Download
から
http://biopython.org/DIST/biopython-1.41.win32-py2.4.exe
をダウンロードし,実行.

6. Pythonがコマンドプロンプトでらくに利用できるようにする.
具体的には環境変数 PATH に C:\python24 を加える.環境変数の変更の仕方は
http://www.atmarkit.co.jp/fwin2k/win2ktips/189setenvv/setenv.html
に図入りで説明がある.
この図における「システム環境変数(S)」の変数 Path を選択し,「編集(I)ボタン」でその値を編集する.具体的には末尾に「;C:\python24」と追加する.もしくは先頭に「C:\python24;」とする.「;」は区切り記号.

7. BioPythonの簡単な動作確認.
Windowsの「スタートボタン - ファイル名を指定して実行」でcmdを実行し,コマンドプロンプトを起動.
そこでpythonと入力してEnterで,Pythonインタプリタを起動.以下を順次入力.
from Bio.Seq import Seq
from Bio.Alphabet.IUPAC import unambiguous_dna
new_seq = Seq('GATCAGAAG', unambiguous_dna)
new_seq[0:2]
すると
Seq('GA', IUPACUnambiguousDNA())
と表示される.さらに以下を順次入力.
from Bio import Translate
translator = Translate.unambiguous_dna_by_name["Standard"]
translator.translate(new_seq)
すると
Seq('DQK', HasStopCodon(IUPACProtein(), '*'))
と表示される.これでひとまず確認終了.
Controlを押しながらZを入力し,Pythonインタプリタを終了させ,さらにコマンドプロンプトにて
exit
と入力してEnterでコマンドプロンプトを終了させる.
[PR]
by edogawadai_bio | 2006-10-27 11:58 | comp
<< PythonでHTMLのパース IKATECH >>