塩基配列のBLAST検索などのためのPythonスクリプトを少し書くようになった.生物系というかbioinformatics系ののスクリプティングではBioPerlが有名だが,BioPythonとかBioRubyとかBioCamlとかもある.ネーミングや位置づけはそれぞれ似てるが,とくに統一した仕様があるわけではないようで,規模もさまざまだ(たぶんBioPerlが一番でかい).
Linux(debian etch)でのBioPythonの導入 % apt-cache search biopy で出てくるパッケージを導入すればよい. Windows XPでのBioPythonの導入 http://biopython.org/DIST/docs/install/Installation.html に書いてあるのを以下に簡潔にまとめる.なお実際に動作させているPython 2.4系列用のリンクを示す.Python 2.5系列では試していない. 1. Pythonの導入 http://www.python.org/download/ から Python 2.4.4 Windows (x86) installer をダウンロードし,実行する. 2. mxTextTools (文字列操作用モジュール) のインストール http://www.egenix.com/files/python/eGenix-mx-Extensions.html#Download-mxBASE から http://www.egenix.com/files/python/egenix-mx-base-2.0.6.win32-py2.4.exe をダウンロードし,実行. 3. Numerical Python (数値計算モジュール) のインストール http://sourceforge.net/project/showfiles.php?group_id=1369&package_id=1351 から http://jaist.dl.sourceforge.net/sourceforge/numpy/Numeric-24.2.win32-py2.4.exe をダウンロードし,実行. "Numeric Python"は"numpy"に名前が変わり http://sourceforge.net/project/showfiles.php?group_id=1369&package_id=175103 から入手可能だが,biopython & Windowsと組み合わせてテストしていない. 4. ReportLab (PDF生成モジュール) のインストール (必須ではない) http://www.reportlab.org/downloads.html から http://www.reportlab.org/ftp/ReportLab_2_0.zip をダウンロードし,展開. 生成した reportlab フォルダを C:\Python24\Lib\site-packages\ にコピー.つまりC:\Python24\Lib\site-packages\reportlab\... となるようにする. 5. BioPython (生物学用モジュール) のインストール http://biopython.org/wiki/Download から http://biopython.org/DIST/biopython-1.41.win32-py2.4.exe をダウンロードし,実行. 6. Pythonがコマンドプロンプトでらくに利用できるようにする. 具体的には環境変数 PATH に C:\python24 を加える.環境変数の変更の仕方は http://www.atmarkit.co.jp/fwin2k/win2ktips/189setenvv/setenv.html に図入りで説明がある. この図における「システム環境変数(S)」の変数 Path を選択し,「編集(I)ボタン」でその値を編集する.具体的には末尾に「;C:\python24」と追加する.もしくは先頭に「C:\python24;」とする.「;」は区切り記号. 7. BioPythonの簡単な動作確認. Windowsの「スタートボタン - ファイル名を指定して実行」でcmdを実行し,コマンドプロンプトを起動. そこでpythonと入力してEnterで,Pythonインタプリタを起動.以下を順次入力. from Bio.Seq import Seq from Bio.Alphabet.IUPAC import unambiguous_dna new_seq = Seq('GATCAGAAG', unambiguous_dna) new_seq[0:2] すると Seq('GA', IUPACUnambiguousDNA()) と表示される.さらに以下を順次入力. from Bio import Translate translator = Translate.unambiguous_dna_by_name["Standard"] translator.translate(new_seq) すると Seq('DQK', HasStopCodon(IUPACProtein(), '*')) と表示される.これでひとまず確認終了. Controlを押しながらZを入力し,Pythonインタプリタを終了させ,さらにコマンドプロンプトにて exit と入力してEnterでコマンドプロンプトを終了させる.
by edogawadai_bio
| 2006-10-27 11:58
| comp
|
カテゴリ
以前の記事
2009年 11月 2009年 04月 2009年 01月 2008年 12月 2008年 11月 2008年 09月 2008年 07月 2008年 05月 2008年 04月 2008年 03月 2007年 11月 2007年 09月 2007年 08月 2007年 07月 2007年 06月 2007年 04月 2007年 01月 2006年 12月 2006年 11月 2006年 10月 2006年 09月 2006年 08月 2006年 07月 2006年 05月 2006年 03月 2006年 02月 2006年 01月 2005年 12月 フォロー中のブログ
リンク
検索
その他のジャンル
ファン
記事ランキング
ブログジャンル
画像一覧
|
ファン申請 |
||