>  > BLITZ ブリッツ 車高調 DAMPER ZZ-R 92326 シフォンカスタム LA600F 16/12~ KF-VE KF-DET 2WD ※沖縄・離島 送料2160円(税込)

BLITZ ブリッツ 車高調 DAMPER ZZ-R 92326 シフォンカスタム LA600F 16/12~ KF-VE KF-DET 2WD ※沖縄・離島 送料2160円(税込)

DNA 塩基配列を文字列で表現する


(図1) この日記で書きたかったことを漫画にしました。

BLITZ ブリッツ D.A.D 車高調 DAMPER ZZ-R 92326 シフォンカスタム 439090 LA600F 16/12~ KF-VE KF-DET 2WD ※沖縄・離島 送料2160円(税込)

  • DNA の塩基配列は ATGC の 4 文字からなる文字列で表現できます。
  • 二本鎖 DNA や二本鎖 RNA を 1 次元配列で表現できるのは、塩基対によって相補鎖を求められるため。
  • DNA や RNA について調べるときに文字列の問題として計算機上で扱えば、文字列のアルゴリズムを適用できます。

NOTE: どうして専門分野外の DNA の話を?
文字列アルゴリズムに関する論文やテキストを読むと、かならずと言っていいほど「DNA は ATGC からなる文字列で表せる」と書いています。

BLITZ ブリッツ 車高調 DAMPER ZZ-R 92326 シフォンカスタム LA600F 16/12~ KF-VE KF-DET 2WD ※沖縄・離島 送料2160円(税込),[#tong##]

車メーカーSUBARU スバル車種CHIFFON CUSTOM シフォンカスタム型式LA600F年式16/12~エンジンKF-VE KF-DET適合備考2WD品番92326各仕様\前後FrontRearマウント強化ゴム純正バネレート6.03.4スプリング自由長150230スプリングタイプSTBS車高調整範囲-90~0-71~-33リア減衰ダイヤルA:アッパーマウント上側92353 ND5RC92318 ZWR80G位置・形状については写真を参考にして下さい。画像は一例です。備考リアショック上部内装、サービスパネル要加工または取り外し納期についてメーカー在庫があれば3~4営業日、欠品時は受注生産の為1ヶ月~お時間がかかります。※納期が遅い等によるキャンセルは一切お受けできません。注意事項※ リア用減衰延長ダイヤル取り付けにはパネル・スピーカーボードなどに穴あけ加工が必要になります。※ アッパーマウント仕様で「※」となっているものについてはBLITZサポートセンターにお問い合わせください。※ 車高調整範囲はロアブラケット側で車高調整を行った場合の調整可能範囲になります。グレード・車両重量・車両誤差などにより調整範囲は変わる場合があります。※ 車高調整範囲内であってもインナーフェンダーなどに干渉する場合があります。また、最低地上高は各車ご確認の上、車高を設定してください。※ スプリングタイプは「ST:ID62ストレートスプリング」「BS:樽型orテーパー型 専用形状スプリング」をあらわしております。※ 「純正アッパーマウント」「純正ゴムマウント」採用しているアイテムは、一部純正部品を再使用いたします。純正サスペンション以外からの取り付けの際には注意願います。※ 再使用する純正部品にへたりや不良がある場合には新品の部品に交換していただくことをお勧めいたします。※ DAMPER ZZ-Rシリーズを取り付けたことにより各装置の認識に使用されるレーダーやカメラ、センサー等の認識範囲がノーマル状態と異なり誤動作を起こす可能性も考えられます。各自動車メーカーの安全装置・衝突回避支援装置・運転支援装置装着車など誤動作の発生やそれに伴う事故などの損害について弊社はその責任を負うことができませんので、ご了承ください。※ DAMPER ZZ-Rシリーズ取り付け時、特にストラット式サスペンションの場合、純正ホイール・タイヤでもショックアブソーバーと干渉する可能性があります。※ DAMPER ZZ-R Spec-C取り付け時、装着しているホイール・タイヤサイズによっては別タンクと干渉する恐れがあります。※ B.R.A.I.N.接続が「○」の車種でも、年式により適合しない場合があります。「Touch-B.R.A.I.N.」「Smart-B.R.A.I.N」適合表をご確認ください。※ DAMPER ZZ-R SpecDSC取り付け時、ストラットタワーバー装着車(純正OP品、社外品)は形状によりモーターが装着できない可能性があります。※ 商品ならびに価格は改良のため、予告なく変更する場合があります。また、上記の設定車種は予告なく販売を中止する場合があります。車高調整範囲は車両個体差、装備により数値が上下することがあります。※ バネレート・・・単位はkgf/mm※ メーカー直送の為、代金引換でのご注文はキャンセルさせて頂きます。カード・銀行振込をご利用下さい。※ お客様の見落としや確認ミスでのキャンセル・交換・返品は一切お受けできません。※ 適合情報は随時更新しておりますが、告知なくメーカー側にて更新される場合がございますので、必ずご注文前にメーカー適合表にて最新の適合表をご確認頂ますようお願い致します。ZZR 車高調整 ダンパー サス ローダウン

。 特に文字列の編集距離の話でよく登場します。 例えば、 Text Algorithms [MR]Algorithms on Strings [MHL] といった書籍にも出てきますし、 O(ND) Difference Algorithm [Myers] のイントロダクションでも DNA の話は出てきます。 DNA だけでなく RNA や タンパク質のアミノ酸配列の話も出てきます。 ところで、 DNA の二重らせんモデルの絵を思い浮かべてみると「どうして二重らせん構造なのに一次元配列 1本 で表せるのか」という疑問が湧き上がりました。 そこで、必要最小限の内容にしぼって「どうして DNA は文字列で表せるのか?」という話を日記に書きます ズーム ダウンフォース 1台分 ダウンサス レガシィ BD2 ZSB038009SDF Zoom ダウンスプリング バネ ローダウン コイルスプリング【店頭受取対応商品】 ミツビシ シャリオ/グランディス 93.5~97.10 N34W/N44W ACRE(アクレ) ブレーキパッド スーパーファイター 309 フロント 左右セット ブレーキ アクレ パッド。

計算機で DNA 塩基配列を扱おう

DNARNA, タンパク質 という言葉を聞くと生物学や化学の世界を最初に思い浮かべますが、計算機の上でそれらを表現できるのであれば計算機科学の世界の話として扱えます。 実は、計算機科学ではこれらを文字列として扱うことができます。 ただの文字列であれば、それがウイルスの進化系統樹の作成であろうと、もっと一般的な文字列の問題として扱うことができ、文字列のアルゴリズムを適用できます。 それでは何をどうやって文字列として扱っているのでしょうか?

DNA の塩基配列を文字列で表す

DNA (deoxyribonucleic acid, デオキシリボ核酸) の塩基配列は、ATGC の 4 文字からなる文字列 (または 1 次元配列) で表現できます。 例えば、実際の Variola virus (天然痘ウイルス) の DNA 塩基配列は次のように表現できます1

CTCGAGAGTATATGTTGTTGAACGTTATTGTTTGAGAAATAGTTGATGCATCAGAATGGTTTGCATTTAT

DNA は ヌクレオチド が鎖状に繋がってできています。 ヌクレオチドは リン酸 2、そして 4 種類の 塩基 のうちの 1 個から構成される物質です。(図2, 図3参照) 4 種類の塩基は次の通りです。

  • Adenine (アデニン)
  • 92326 シフォンカスタム ※沖縄・離島 シフォンカスタム ブリッツ ブリッツ 2WD LA600F ZZ-R DAMPER KF-DET BLITZ 車高調 KF-VE 16/12~ 送料2160円(税込)

  • Thymine (チミン)
  • Guanine (グアニン)
  • Cytosine (シトシン)


(図2) リン酸 (phosphate) と糖 (sugar) そして 4 種類の塩基 (Base) Adenine, Thymine, Guanine, Cytosine のモデル図


(図3) ヌクレオチド (Nucleotide) のモデル図

ATGC の文字集合は、この 4 種類の塩基 Adenine, Thymine, Guanine そして Cytosine の頭文字に由来します。 また、ヌクレオチドが鎖のように繋がったものを 塩基配列 (sequence) といいます。 DNA は 2 本のヌクレオチドの鎖が 二重らせん構造 になるように、ヌクレオチドの塩基と塩基が組み合わさってできています。(図4参照)


(図4) ヌクレオチドの鎖が 2 本組み合わさってできた DNA のモデル図

ここで気になるのが、どうして二重らせん構造なのに DNA の塩基配列を 1 次元配列(または文字列)で表現できるのかということです。例えば 図4 では ACTGTGAC の 2 つの 1 次元配列を用意する必要があるのではないかと感じます。

この疑問に答えるのが 塩基対 (base pair, bp) です。A は T と、 G は C と必ず対になります。(図5参照) この組み合わせを塩基対といいます。


(図5) Adenine は Thymine と、 Guanine は Cytosine と塩基対を作る

DNA は二本の鎖が塩基対により 相補的 (complementary) に組み合わさってできています 3。 塩基対の関係を使えば、片方の塩基配列から対になるもう片方の塩基配列(これを 相補鎖 といいます)がわかります。例えば ACTG なら塩基対の関係から、もう片方の塩基配列は TGAC とわかります。(図6参照)


(図6) 塩基対の関係からもう片方の塩基配列を求められる

ここから DNA の塩基配列は ATGC からなる文字列(または 1 次元配列)で表現できることがわかります。

RNA

RNA (ribonucleic acid, リボ核酸) も DNA と同様に文字列で表現できます。 DNA と異なるところは、構成する塩基です 4。 RNA は次の 4 種類の塩基から構成されています。

  • Adenine (アデニン)
  • Uracil (ウラシル)
  • Guanine (グアニン)
  • Cytosine (シトシン)

また、RNA には二重らせん構造の RNA と、一本の鎖から成り立つ RNA の二種類があります5。 RNA の場合も DNA と同じように塩基対の関係があり、 A は U と、 G は C と結合します。 なので、一本鎖 RNA も二本鎖 RNA も AUGC の 4 種類の文字からなる文字列で表現できます。

実際の RNA ウイルスを文字列で表現した例を示します。 2016 年にノースカロライナで見つかった豚インフルエンザウイルスの RNA の一部です6 【イベント開催中!】 Magical Racing マジカルレーシング フロントフェンダー 素材:FRP製(ブラック) CBR900RRファイアーブレード。

ATGAAGGCAGCACTAGCAGTCCTGCTATATGCATTTACAACTGCAAATGCCGACACATTATGTATAGGCT

ここで U (Uracil) ではなく T で表記されていることに違和感を覚えるかもしれません。 RNA なので T ではなく U と表記してよいのですが、ここでは FASTA フォーマット7 の慣例に従い Uracil を T で表記しています。

タンパク質

DNA や RNA といった 核酸 と同じように タンパク質アミノ酸配列 も文字列で表現できます。 今回はアミノ酸配列についての説明を省略しますが、タンパク質は 20 種類のアミノ酸が 1 次元配列でつながったものです。 20種類のタンパク質はそれぞれ ACDEFGHIKLMNPQRSTVWY のアルファベット一文字で表記されます。 ちなみに、ここで使われていないアルファベットは BJOUXZ の 6 文字です。

文字列として見たときの DNA

DNA ウイルスだけでなく、地球上のどんな生物の DNA も ATGC からなる文字列として表現できます B1 BATTERY(ビーワンバッテリー) トヨタ ピクシスエポックB1 バッテリー M-42 12/05~ ピクシスエポック DBA-LA310A 【アクレ/acre】 BMW 3 series E46 等にお勧め フォーミュラ700C [リア用] 左右セット ブレーキパッド 型式等:3.2 M3 品番:β316。 また、進化的に近い種は DNA の塩基配列も似ています。

DNA を文字列と見立てたとき、文字列同士の 類似度のようなもの を求めれば、進化的に近い種かどうかを調べることができます。 この類似度のようなものを計算機科学の世界では、 文字列の 編集距離 (edit distance) といいます 。 編集距離にはいくつか種類があり、例をあげると レーベンシュタイン距離 (Levenshtein distance)ハミング距離 (Hamming distance), Jaro-Winkler distance などがあります。 この中でよく使われるのはレーベンシュタイン距離です。

また多くの生物で共通する文字の並びがわかれば、生命にとって重要な塩基配列やアミノ酸配列がわかります。 この共通する文字の並びを 共通部分列 (common subsequence) と言います 8。 2 つの文字列間で共通する 部分列 (subsequence) の中で最長となるものを 最長共通部分列 (longest common subsequence, LCS) といい、計算機科学の世界では LCS を求める問題を LCS Problem といいます9

アラインメント

遺伝子工学の世界では、共通部分列を求めることを アラインメント (alignment) と言います。 アラインメントは、2 つの文字列を比較して共通する部分を揃えて、2 つの文字列間の共通点を可視化したものです。

例えば、アラインメント前の 2 つの文字列を x, y とします。

x = "AGCTCGAATATGC"
y = "ACTGAAGAGC"

x, y のアラインメント結果は次のようになります:

AGCTCGAAT-ATGC // x
A-CT-GAA-GA-GC // y

ここで揃えるために挿入した - (ハイフン) のことを ギャップ (gap) または ホール (hole) といいます。

マルチプルアラインメント

2 つ以上の文字列の共通点を可視化したものを マルチプルアライメント (multiple alignment) (または Multiple Sequence Alignment, MSA) といいます。

マルチプルアラインメントの入力例は次のように、複数の文字列になります。 ここでは文字列 x, y, z, w を入力としてマルチプルアライメントを求めてみます。

x = "AGCTCGAATATGC"
y = "ACTGAAGAGC"
z = "CGAAGAC"
w = "TCAATT"

これらの文字列のアラインメント結果は次のようになります。

AGCTCGAAT-ATGC // x
A-CT-GAA-GA-GC // y
--C--GAA-GA--C // z
---TC-AAT--T-- // w

このマルチプルアライメントの結果から何がわかるのでしょうか? 例えば、 x, y, z, w がそれぞれヒト、牛、魚、カブトムシの DNA だとします。 すると次のことが見えてきます。

  • ヒトと牛が(魚やカブトムシに比べて)近い種かも?
  • AA は地球上の生物にとって大事な塩基配列かも?

例では 4 つの文字列のみですが、このアラインメントの操作をたくさん集めた塩基配列のサンプルにたいして行って、インフルエンザウイルスの進化系統樹を作成したり、動物にとって重要な塩基配列やアミノ酸配列を見つけることができます。

文字列のアルゴリズムを使おう

昔はこれらの塩基配列のアラインメントを、生物学者みずから手作業で求めていたそうです。 インフルエンザウイルスの RNA 塩基配列は短いものでも 800 文字、長いと 2200 文字ほどになります10。 これを経験とセンスだけでアラインメントするのはとても大変です。 そこで DNA は文字列なので、今では計算機上でアラインメントを自動的に求められます。もちろん文字列なので文字列のアルゴリズムが使えます。

アラインメントを「文字列 x を文字列 y に変換する編集操作の手順」と見なせば、アラインメントを求める問題は 「M 個の文字列間の LCS を求める問題」または「Edit graph (エディットグラフ) を求める問題」に変換することができます。

ちなみに、以下の問題は Edit graph を求める問題に変換できます。

  • 編集距離を求める (Edit distance problem)
  • 最長共通部分列を求める (LCS problem)
  • 文字列の差分 diff を求める (文字列 x を文字列 y にする最小の編集操作の手順)

大雑把に言ってしまうと、 Edit graph さえ求めてしまえば、編集距離も LCS も diff もアラインメントも求まります。 これらの文字列アルゴリズムの問題例に DNA の塩基配列が使われるのはそういった背景があります。

機会があれば、次回は計算機科学の世界に戻って LCS の話をします。

参考文献

  • [Myers] Myers, E.W. "An O(ND) difference algorithm and its variations." Algorithmica Volume 1, Issue 1-4. (1986) 251-266.
  • [MR] Crochemore, Maxime and Wojciech Rytter. Text Algorithms. (ISBN-13: 978-0195086096)
  • [MHL] Crochemore, Maxime, Christophe Hancart and Thierry Lecroq. "Alighnment". Algorithms on Strings. (ISBN-13: 978-1107670990) Chapter 7.
  • 星田昌紀, 遺伝子情報処理への挑戦 - コンピュータとバイオのフュージョン (ISBN-13: 978-4320026933) (1994)
  • Molecular Biology of the Cell, 5th edition. - MBoC の最新版は第6版です。
  • https://www.ncbi.nlm.nih.gov/genome - NCBI のデータベース。 DNA と RNA の FASTA 表記の実例として引用しました。

  1. Variola virus の塩基配列の一部。NCBI Reference Sequence: NC_001611.1 から引用しました (https://www.ncbi.nlm.nih.gov/nuccore/9627521?report=fasta

  2. DNA を構成する糖はデオキシリボース (deoxyribose)、RNA を構成する糖はリボース (ribose) です。 

  3. DNA の二本の鎖にはそれぞれ名前がついていて、発見者名をとって片方を Watson strand (ワトソン鎖)、もう片方を Crick strand (クリック鎖) と呼びます。 

  4. 構成している糖も DNA と RNA で異なります。 

  5. 少し前まで RNA は一本鎖だと言われていましたが、1998 年に RNAi とともに 二本鎖 RNA が発見されました。そのため、それ以前の書籍を見ると RNA に関して「一本鎖」と記述されていることがあります。 

  6. Influenza A virus の塩基配列の一部。NCBI GenBank: KU598329.1 から引用しました (https://www.ncbi.nlm.nih.gov/nuccore/992420281?report=fasta

  7. FASTA フォーマットは広く使われている塩基配列やアミノ酸配列のデータ表現のひとつです。 FASTA フォーマットについてはこちらを参照ください: Formatting your Submission - The GenBank Submissions Handbook 

  8. ここでは、部分列 (subsequence) と部分文字列 (substring) を区別しています。 

  9. 実のところ LCS を求めることとレーベンシュタイン距離を求めることはまったく同じ問題です。 

  10. NCBI に登録されている Influenza A virus がそのくらいの長さ。長さの単位は bp (base pair) で、ATGC の 1 文字が 1 bp に相当します。

    BLITZ ブリッツ 車高調 DAMPER ZZ-R 92326 シフォンカスタム LA600F 16/12~ KF-VE KF-DET 2WD ※沖縄・離島 送料2160円(税込)

    。 

Leave a Reply

{yahoojp}jpprem01-zenjp40-wl-zd-35483