SWine Imputation (SWIM) ハプロタイプ参照パネルにより、ブタのヌクレオチド分解遺伝子マッピングが可能になります
ホームページホームページ > ニュース > SWine Imputation (SWIM) ハプロタイプ参照パネルにより、ブタのヌクレオチド分解遺伝子マッピングが可能になります

SWine Imputation (SWIM) ハプロタイプ参照パネルにより、ブタのヌクレオチド分解遺伝子マッピングが可能になります

Nov 11, 2023

Communications Biology volume 6、記事番号: 577 (2023) この記事を引用

192 アクセス

2 オルトメトリック

メトリクスの詳細

ブタなどの家畜における経済的に重要な量的形質の変動に関連する、またはその原因となる遺伝子および対立遺伝子を特定するための遺伝子マッピングは、動物の遺伝的改善における主要な目標です。 ハイスループット遺伝子型解析技術の最近の進歩にも関わらず、遺伝子型解析された変異部位の密度が低いこともあり、ブタの遺伝子マッピングの分解能は依然として低いままです。 この研究では、44 品種のブタを代表する 2,259 頭の全ゲノム配列決定動物に基づいてブタの参照ハプロタイプ パネルを開発することで、この制限を克服しました。 ソフトウェアの組み合わせと品種構成を評価して代入手順を最適化し、96%を超える平均一致率、88%の非参照一致率、および0.85のr2を達成しました。 私たちは 2 つのケーススタディで、このリソースを使用した遺伝子型補完により、遺伝子マッピングの解像度が劇的に向上する可能性があることを実証しました。 豚遺伝学コミュニティがこのリソースを最大限に活用できるようにするために、公開 Web サーバーが開発されました。 私たちは、このリソースが遺伝子マッピングを促進し、ブタの遺伝的改良を促進することを期待しています。

イエブタ (Sus scrofa) は重要な家畜種であり、生物医学研究のモデル生物です1。 歴史的には、家畜化と激しい人為的淘汰により、遺伝的にも表現型的にも互いに、また野生の近縁種とは異なる多くのブタ品種が生み出されてきました2、3、4。 最近では、ハイスループットの DNA 配列決定および遺伝子型解析技術 5 により、ブタの遺伝的改良が促進されました。 例えば、何百ものゲノム規模の関連性および量的形質遺伝子座 (QTL) マッピング研究により、さまざまな生産、生理学的、および行動の表現型に関連する多数のゲノム領域が特定されています6。 これらの研究は、成長 7、生殖能力 8、病気耐性 9 など、経済的および生物医学的に重要な形質の遺伝的および生物学的基盤を理解するために重要です。

ブタの遺伝子マッピングの分解能は、一塩基多型 (SNP) 遺伝子型解析アレイの密度が低いことが部分的に原因で、依然として不十分です。 解像度の制限を克服するための実証済みの費用対効果の高いアプローチの 1 つは、連鎖不平衡を利用して、観察されていない多型遺伝子座の遺伝子型を推測する遺伝子型補完によるものです10。 全ゲノム配列決定によって作成された大規模なハプロタイプ参照パネルを使用すると、代入によって配列レベルの遺伝子型が得られる可能性があります 11。 QTL 同定と遺伝的予測が 2 つの主要な目標であり、連鎖不均衡が広範囲に及ぶ家畜動物では、比較的少数の参照ハプロタイプを使用して配列レベルの遺伝子型補完がうまく適用されていますが、かなりの精度が得られています 12、13。特にブタでは、少なくとも 2 つのパブリック代入サーバーが利用可能です 14、15。しかし、参照パネルに含まれる動物の数が非常に限られているか 14、または主要な商業品種からの適切な表現が欠如しており 15、その用途が制限されています。 さらに、多くの研究でマッピング解像度 16 とゲノム予測精度 17 の向上が実証されていますが、これらはいずれも公的にアクセスできません。

この研究では、新たに配列決定された 1,530 頭のブタから​​全ゲノム配列データを作成し、それらを公共データベースからの追加の 729 頭の動物と組み合わせてバリアントを呼び出し、これまでで最大かつ最も多様なブタのハプロタイプの参照パネルを開発しました。 この利用可能なゲノム数の大幅な増加により、SNP アレイの遺伝子型を全ゲノム配列に迅速かつ正確に代入できるようになりました。 私たちは代入の精度を評価し、ゲノム全体の関連性マッピングにおけるこのハプロタイプ参照パネルの有用性を実証しました。 私たちは、ユーザーが配列遺伝子型を送信し、代入された全ゲノム配列レベルの遺伝子型を取得できる新しい公開 Web サーバー (swimgeno.org) を導入します。 このリソースにより、高精度の遺伝子型補完へのアクセスが大幅に向上し、ブタにおける潜在的なヌクレオチド分解遺伝子マッピングが容易になります。

新たに配列決定された動物(n = 1530)からの全ゲノム配列データと、44 の異なる品種を表す合計 2259 頭の豚の公的に入手可能なデータ(補足データ 1 および 2)を統合しました(補足データ 1)。 動物の大多数は、ランドレース (n = 651)、ヨークシャー (n = 543)、およびデュロック (n = 485) という 3 つの主要な商業品種でした。 独自に整列された配列の深さは、すべての動物の平均で約 12.86 倍でした (補足データ 1)。 GATK パイプラインを使用してバリアントを呼び出し、市販の SNP アレイからコンパイルされた既知のバリアント セットを使用してバリアント品質スコアを調整しました。 低品質、過剰なヘテロ接合性および欠損の変異体を除外した後、4,786 M 個の常染色体変異体が残りました。 動物のサブサンプリングにより、発見された変異体の数の増加が急速に減少したことが示されました(図1a)。 無作為に選択した 1000 匹の動物のみを使用して、全変異体の 95% 以上を回収できました。

a 発見コホート内の動物の数に応じて発見された変異体の数。 この曲線は、集団をランダムにサブセット化し、多型性を維持する DNA バリアントをカウントすることによって生成されます。 1000 匹の動物と 2259 匹の動物のセット全体を使用して発見された変異体の数がマークされます。 b 4 つの国産品種と 3 つの地域の野生イノシシにおけるペアワイズ連鎖不平衡。 平均 r2 がバリアント間の距離に対してプロットされます。 LD は、デュロック 435 頭、在来種 522 頭、ヨークシャー 493 頭、メイシャン 36 頭、ヨーロッパイノシシ 24 頭、アジアイノシシ 27 頭の低頻度変異体 (MAF < 0.05) と近縁種 (GRM > 0.5) を除去した後に計算されました。 c 共通 (MAF > 0.05) および LD 枝刈りバリアントの遺伝子型行列の最初の 2 つの主成分の散布図。 ポイントは、報告された品種情報に従って色分けされています。 予備的な主成分分析を実行して、品種情報のエラーを示す明らかな外れ値を視覚的に検査してクラスターから除去しました。 d ADMIXTURE ソフトウェアを使用して、変数 (K = 2、4、6) の推定祖先集団数を使用してブタの祖先を推定しました。 推定祖先は積み上げ棒グラフとしてプロットされ、上部に品種の注釈が付けられました。 棒グラフの上の注釈に加えて、K = 6 の場合、広範囲の地理的位置も棒グラフの下に注釈が付けられます。

この集団におけるバリアント間の連鎖不均衡(LD)は広範でしたが、品種によって異なりました(図1b)。 野生イノシシのLDは、国産品種よりも変異間の距離が増加するにつれてより急速に低下しました。これは、集中的に選択された国産品種間の近親交配のレベルが高いことと一致しています(図1b)。 ブタのゲノムに存在する遺伝的変異により、品種は地理的分化を表す別個のクラスターに分離されました(図 1c、d)。 遺伝子型の最初の主成分はアジアの品種とイノシシをヨーロッパの対応種から区別し、2番目の主成分はデュロックを他の品種から区別しました(図1c)。 品種の推定祖先も、地理的位置に従って明確に分離されたクラスターを示しました(図1d)。 総合すると、この研究に含まれる 2,259 頭のブタゲノムの多様で豊富な遺伝的変異は、全ゲノム代入の強力な基盤となります。

私たちは、ハプロタイプ参照パネルを構築するために、マイナー対立遺伝子頻度 (MAF) > 0.005 で分離する約 34 M の常染色体変異体 (SNP 30,489,782 個およびインデル 4,125,579 個) に焦点を当てました。 代入精度に影響を与える要因を調査するために、SHAPEIT4/IMPUTE5、Beagle5.2/Beagle5.2、Eagle2.4/Minimac4 など、一般的に使用されるフェージングおよび代入ソフトウェアのさまざまな組み合わせを検討しました。 代入遺伝子型と観察遺伝子型の間の全体的な一致率、非参照遺伝子型のみの精度を要約した非参照一致率、および代入遺伝子型と観察遺伝子型の間の二乗相関 (r2) の 3 つの指標を使用して代入精度を定義しました。 データセット内で最も多くの動物が含まれるランドレースにターゲット セットとして焦点を当てました。 我々は、高カバー率(>15X)で配列決定した100頭のランドレース豚を公開し、観察された遺伝子型を、50 K SNPアレイ(GeneSeek GGP)上の部位の配列決定に基づく遺伝子型から始まる帰属遺伝子型と比較しました。 固定サイズのハプロタイプ参照パネルの品種構成に関係なく、SHAPEIT4/IMPUTE5 は 3 つの指標すべてで Beagle5.2/Beagle5.2 および Eagle2.4/Minimac4 を上回りました (図 2a–c)。 したがって、その後のすべての分析には SHAPEIT4/IMPUTE5 が選択されました。

a 550 ランドレースを参照パネルとしてさまざまなソフトウェアの組み合わせを使用した、推定された遺伝子型と観察された遺伝子型の一致率、非参照一致率、r2。 b 同じ分析ですが、ランドレース 250 頭、デュロック 150 頭、ヨークシャー 150 頭からなる参照パネルを使用しています。 c 同じ分析ですが、250 の在来種と 300 のその他の品種 (デュロックやヨークシャーではない) からなる参照パネルで行われます。

牛では、複数品種の参照パネルを使用した補完は、単一品種パネルを使用した場合よりも正確であるようです 12,18。 ただし、複数の品種のパネルはサンプルサイズが大きいため混乱します。 私たちは、単一品種と複数の品種の混合物からの同じサイズの参照パネルを使用した代入が違いを生むかどうかを尋ねました(図3a、L、DLY、およびLOを比較)。 この質問は、最適な精度を達成するために複数品種の参照パネルを使用するか、品種固有の参照パネルを使用するかを判断するため、重要でした。 サンプルサイズが比較的大きいため、我々は再び 100 頭の在来種動物をターゲットセットとして検討しました。 参照パネルのサイズが等しい場合、3 つの指標すべてで測定された補完精度が著しく類似していることがわかりました (図 3b ~ d)。 ターゲットセットと同じ品種に由来する参照パネルには、非常にわずかな利点がありました(図3b〜d)。 ただし、同じ品種からの参照だけでは(サンプルサイズが小さい)同じ精度を達成できないため、複数品種のパネルが役立ちます(図 3、L-250 を他と比較)。 ランドレース豚の大部分は単一集団由来であるため、新しいターゲット セットが他の集団から派生した場合、代入精度は現実的なシナリオを反映しない可能性があります。 参照セットとして 550 頭の動物を使用し、ターゲット セットとして SRA の在来種豚 41 頭を使用して代入精度を評価しました。これは、ターゲット セットが参照セットから離れている状況を表しています。 代入精度は低く、多品種パネルには小さな利点があるように見えました(補足図1)。 参照パネルを 2218 匹の動物に拡張すると、精度が大幅に向上しました (補足図 2)。 精度が低いのは、対象となる動物の数が少ないことと、参照パネルからの遺伝的距離がさらに離れていることが原因である可能性があります。 まとめると、同じサイズの複数品種と品種固有のパネルの比較は特定の状況によって異なりますが、ほとんどの場合、参照パネルのサイズを最大化できるため、品種固有の参照パネルではなく複数品種の参照パネルが望ましいと考えられます。 。

a ハプロタイプ参照パネルの品種構成が代入精度に及ぼす影響を調査するための実験計画。 「L」を含む 3 つの参照パネルをテストしました: 550 の在来種動物。 「DLY」: デュロック種、ランドレース種、ヨークシャー種の豚 550 頭。 「LO」: 在来種およびその他の非デュロック種またはヨークシャー種の豚 550 頭。 「L-250」: 在来種動物のみ 250 頭。 100 のランドレースがターゲット セットとして使用されました。 ハプロタイプ参照パネルの異なる品種構成を使用した、推定遺伝子型と観察遺伝子型の一致率 (b)、非参照一致率 (c)、および r2 (d)。

多品種参照パネルを使用した SWine Imputation (SWIM) リソースと、SRA15 で公開されている 1006 匹の動物を利用したブタ用の Imputation サーバー (PHARP) を比較しました。 両方の参照パネルに存在するバリアント間の補完精度を評価しました。 PHARP には、ヨークシャー 115 頭、デュロック 85 頭、在来種 48 頭など、比較的少数の主要な商業品種が含まれていました。 GWAS の大部分が実施されているランドレース、デュロック、およびヨークシャーのターゲット セットを検討しました (図 4a)。 代入精度を評価する際、対象セットとして 100 匹の動物を用意し、残り (n = 2159) をハプロタイプ参照パネルとして使用しました。 全体的な一致率は一様に高かった(>94.24%)が、本研究で開発されたSWIMパネルを使用した補完は、各品種内で一貫してPHARPよりも高かった(図4b)。 特に低頻度で精度をより忠実に反映する 2 つの指標である非参照一致率と r2 を考慮すると、改善はさらに顕著でした (図 4c、d)。 SWIM と PHARP の違いは、特に評価対象の品種のサンプル サイズの違いである可能性があります。 2259 匹すべての動物からなる最終的な参照ハプロタイプ パネルは、95.84% を超える一致率、88.26% の非参照一致率、および 0.85 の r2 を達成すると予想されます。

a SWIM と PHARP のさまざまなシナリオを含むハプロタイプ参照パネルの構成とターゲット セット。 SWIM-100Y、SWIM-100D、SWIM-100L はそれぞれ、ターゲット セットとしてヨークシャー 100 頭、デュロック 100 頭、ランドレース 100 頭を保持しています。 PHARP 参照パネルの場合、同じ 100 頭のヨークシャー、100 頭のデュロック、および 100 頭のランドレースが代入精度の評価に使用されます。 b 異なるハプロタイプ参照パネルを使用した、推定された遺伝子型と観察された遺伝子型の一致率。 すべてのバリアントにわたる平均一致率も、各参照パネルのプロットに示されています。 c 異なるハプロタイプ参照パネルを使用した、推定された遺伝子型と観察された遺伝子型の非参照一致率。 すべてのバリアントにわたる平均非参照一致率も、各参照パネルのプロットに示されます。 異なるハプロタイプ参照パネルを使用した、推定された遺伝子型と観察された遺伝子型の d r2。 すべてのバリアントにわたる平均 r2 も、各参照パネルのプロットに示されています。

また、GeneSeek GGP 50K、Affymetrix Wens 55K、Affymetrix Axiom PigHD 660K など、さまざまな開始 SNP チップのパフォーマンスも評価しました。 これらのチップが選択されたのは、Wens 55K と GGP 50K の SNP 数は同程度ですが、共有する SNP が少なく、Axiom PigHD の方が密度が高いためです。 代入精度は、100デュロックで、2159匹の動物を参照として使用して評価されました(補足図3a)。 プローブが参照ゲノムに独自にマッピングされなかった、または単型である SNP を除去した後、39,491、48,337、および 561,111 個の SNP が、それぞれ GeneSeek GGP、Wens、および Axiom PigHD のハプロタイプ参照パネルと重複しました(補足図 3b)。 予想どおり、SNP の密度が高いと 3 つの指標すべてで代入精度が向上し (補足​​図 3c–e)、Affymetrix PigHD 660K SNP チップは全体の一致率 99.50% (補足図 3c)、98.63 で著しく高い精度を達成しました。 %非参照一致率(補足図3d)、および0.98 r2(補足図3e)。

遺伝的マッピングにおける配列レベルの遺伝子型補完の有用性を実証するために、我々は、SNP アレイと補完された遺伝子型の両方を使用して、ブタの 2 つの重要な成長形質についてゲノムワイド関連研究 (GWAS) を実行しました。 背脂肪の厚さと体長という 2 つの形質が選択されたのは、原因と推定される遺伝子と変異が以前によく特徴付けられていたためです。 私たちの目的は、代入ベースの GWAS が以前に検証された機能的な遺伝子とバリアントを発見できるかどうかを確認することでした。

背脂肪の厚さ(BF)は豚の最も重要な経済形質の 1 つであり、その遺伝的根拠については集中的に調査されてきました。 アレイSNPまたは帰属SNPのいずれかを使用して推定されたゲノム遺伝率は類似しており、中程度に遺伝性の形質を示しました(図5a)。 IGF219、20、MC4R21、LEPR22などのいくつかの遺伝子の対立遺伝子は、一貫してブタのBF変異と関連しています。 特に、MC4R 遺伝子のミスセンス変異 (chr1:160773437:G>A) が原因変異として示唆されており 21、複数の遺伝的背景で広範囲に複製されています 23。 さらに、MC4R の変異はヒトの早期発症の肥満と強く関連しており 24、エネルギー恒常性の調節における MC4R の役割は十分に確立されています 25。 重要なことは、MC4R の原因と推定される変異が、市販の SNP ジェノタイピング アレイの 1 つである Geneseek GGP Porcine 50K SNP Chip (Neogen、リンカーン、ネブラスカ州) に含まれていることです。 ただし、同じ SNP は、より広く使用されている Illumina PorcineSNP60 チップには存在しません。 遺伝子型補完がこの SNP の遺伝子型を正しく補完できるかどうかを確認するために、MC4R SNP を除外し、GGP ブタ 50K SNP アレイを使用して遺伝子型決定された 3769 頭のデュロック豚の集団から全ゲノム遺伝子型を補完しました。 注目すべきことに、帰属された MC4R SNP 遺伝子型とアレイ MC4R SNP 遺伝子型の間の一致率と r2 は、それぞれ 99.71% と 0.9916 でした。 配列と補完された遺伝子型を使用して GWAS を実行しました。 どちらも、染色体 1 上の主要なピーク (図 5a、補足データ 3 および 4) と、ヌルからの P 値分布の明らかな偏差 (補足図 4a) を示しました。 代入された遺伝子型を使用すると、代入された SNP からの最大のヒット (chr1:161511936:T > C、P = 2.98 × 10−13) により、表現型の総分散の 2.85% が説明されました (図 5a)。 4 Mb 領域 (158.5 ~ 162.5 Mb) のこのピークの下には、22 遺伝子内に 7138 個の変異がありました。 この領域の連鎖不平衡は広範囲に及んでおり、強いLD(r2 > 0.8)の1050の変異体があり、そのトップヒットにはMC4R SNPが含まれていました(図5b)。 最大のヒットは遺伝子 CCBE1 のイントロン SNP でした (図 5b)。 しかし、この領域には広範な LD が存在するため、遺伝子データだけで原因となる変異を特定することは困難です。 原因遺伝子と変異をさらに詳細にマッピングするには、LD を破壊する追加の機能情報と遺伝データが必要です。 それにもかかわらず、推定上の MC4R の原因となる SNP を、高 LD 領域の長い範囲で上位に関連するバリアントの 1 つとして特定できることは、帰属遺伝子型を使用した解像度の向上を明らかに実証しました。 私たちの分析では、MC4R SNP は最初に削除されており、Illumina PorcineSNP60 チップが使用された場合と同様、代入なしでは見えなくなります。

背脂肪の厚さに関するゲノムワイド関連研究 (GWAS) のマンハッタン プロット。 背景の灰色 (暗いおよび明るい) の点は、代入遺伝子型を使用した GWAS からのものであり、青色 (明るいおよび暗い) の点は、SNP チップを使用した GWAS からのものです。 アレイおよび代入された遺伝子型を使用して計算されたゲノム遺伝率が示されています。 代入遺伝子型とアレイ遺伝子型を使用した GWAS からの最も重要な SNP は、円と矢印で示されています。 b GWAS の上位ヒットが位置する、染色体 1 の 158.5 ~ 162.5 Mb 領域内の関連。 点は、代入された遺伝子型を使用した染色体に沿った -log10 (P 値) を示し、アレイにも遺伝子型がある SNP は×印でマークされています。 代入遺伝子型とアレイ遺伝子型を使用した GWAS からの上位 SNP は、円と矢印でマークされています。 SNP と先頭 SNP の間の r2 (chr1:161511936:T > C) は青色のグラデーションで示されます。 遺伝子の位置はプロットの下のボックスに示されており、青いボックスと左矢印 (<) の付いた遺伝子名は逆鎖で転写された遺伝子を示し、赤いボックスと右矢印 (>) の付いた遺伝子名は逆鎖から転写された遺伝子を示します。前方ストランド。 マークされていない遺伝子には遺伝子シンボルがありません。 遺伝子の位置は、Ensembl Release 98 の注釈に基づいています。

次に体長を考えてみました。 代入プラットフォームを使用して、Affymetrix 55K SNPチップ(Wens55K)から全ゲノム配列に遺伝子型を代入し、1694頭のヨークシャーイノシシの集団でGWASを実行しました(図6a)。 アレイ遺伝子型 (h2 ~ 0.32) と代入遺伝子型 (h2 ~ 0.34) の両方を使用して推定されたように、この形質は中程度に高い遺伝率を持っています (図 6a)。 GWAS(補足図S4b)を使用して、染色体17上に非常に重要なピークを発見しました(図6a、補足データ5および6)。ここで、リードバリアントはBMP2遺伝子の上流の遺伝子間SNPでした(chr17:15643342:C>T) 、P = 3.45 × 10−39)。 注目すべきことに、この変異体は表現型の全分散の13.65%を説明し、ホモ接合性C/C動物はT/Tホモ接合体よりも平均して4.01cm長かった(図6b、c)。 BMP2 はブタの成長形質に関連していることが繰り返し示されています。 最近の研究では、BMP2 遺伝子の上流にある調節変異体が関与していることが示唆され、レポーター遺伝子を使用してその機能的影響が検証されました 26。 この調節バリアントは、我々の分析ではこのピークの下で 3 番目に重要な SNP でした。 これらの潜在的に調節性の変異の一方または両方が原因となる変異であるかどうかは、まだ解明されていない。 これらの SNP の強い関連性、高い MAF、およびこの領域の LD の範囲が狭いことを考慮すると、これらの調節変異体がタグ付けタンパク質をコードしており、BMP2 遺伝子のあまり一般的ではない変異体である可能性は低いです。 このヨークシャー集団からの遺伝的サポートに加えて、体長を増加させる C 対立遺伝子が他の品種よりもランドレースではるかに蔓延していました。 ランドレース品種の特徴は、その長い体の大きさです。 したがって、BMP2 遺伝子の調節的変異は、ブタ品種間の表現型の区別に大きく寄与している可能性があります。 対照的に、SNP チップはこの領域を広範囲に識別できましたが、SNP チップベースの GWAS における最も重要な SNP (chr17:15827832:T>G、P = 1.58 × 10−25) は、領域から約 184 kb 離れていました。が SNP をリードし、実質的に小さい分散 (8.22% 対 13.65%) を説明しました。

体長に関するゲノムワイド関連研究(GWAS)のマンハッタンプロット。 背景の灰色 (暗いおよび明るい) の点は、代入遺伝子型を使用した GWAS からのものであり、青色 (明るいおよび暗い) の点は、SNP チップを使用した GWAS からのものです。 アレイおよび代入された遺伝子型を使用して計算されたゲノム遺伝率が示されています。 b GWAS のトップヒットが位置する、染色体 17 の 15.3 ~ 16.3 Mb 領域内の関連。 点は、代入された遺伝子型を使用した染色体に沿った -log10 (P 値) を示し、アレイにも遺伝子型がある SNP は×印でマークされています。 代入遺伝子型とアレイ遺伝子型を使用した GWAS からの上位 SNP は、円と矢印でマークされています。 SNP 間の r2 と先頭の SNP (chr17:15643342:C>T) は青色のグラデーションで示されます。 遺伝子の位置は、Ensembl Release 98 の注釈に従って、プロットの下のボックスに示されています。 3 つの遺伝子はすべて赤色で色付けされており、前方鎖から転写されます。 この領域で記号が付いた唯一の遺伝子は BMP2 です。 c chr17:15643342:C>T SNP の 3 つの遺伝子型の体長 (cm 単位) の散布図と箱ひげ図。 ボックスの下限と上限は、それぞれデータの 25% と 75% の分位数、正中線の中央値、ひげの最小値と最大値です。 d さまざまな品種における chr17:15643342:C>T SNP の対立遺伝子頻度。

この研究で開発されたリソースを広範な研究コミュニティが効率的に利用できるようにするために、私たちはパブリック SWine IMputation (SWIM) Web サーバー (https://www.swimgeno.org および https://swim.scau.pigselection.com/) を開発しました。 swim) では、ユーザーは SNP チップの遺伝子型をアップロードし、代入された遺伝子型を取得できます。 ユーザー インターフェイスは非常にシンプルで、ユーザーは遺伝子型を gzip 圧縮された ped/map 形式でアップロードし、電子メール アドレスを残すだけです。 PHARP などの他のサーバーとは異なり、対立遺伝子のマッチングと反転はサーバー側で実行されるため、ユーザー側のプロセスがさらに簡素化されます。 アカウントを登録することなく、代入ステータスを監視し、結果をダイナミック リンクからダウンロードできます。 サーバーは、同じユーザーの複数のジョブを制限しながら、同時に複数のユーザーに対応できるようにセットアップされています。 私たちのテストでは、2,000 人の個人と 50,000 個の SNP チップ遺伝子型を使用する一般的なジョブは、すべての染色体について約 12 時間で完了できることが示されました。

ここでは、ブタにおける最大の参照ハプロタイプ パネルの開発と、このリソースを遺伝子型補完に利用するための一般向けの付随 Web サーバーを紹介します。 高いレベルの多様性とパネル内の多数の動物により、一致率、非参照一致率、r2 がそれぞれ 95.84%、88.26%、0.85 を超える非常に高い代入精度を達成することができました。 50K SNP アレイ (図 2)。 この精度は、家系図付き集団内の中密度 SNP アレイで得られた精度と同等でした 27。 精度が高く、血統を必要とせずに簡単にアクセスできることを考えると、この公的リソースによってブタにおける配列レベルの代入が大幅に民主化され、遺伝的発見が加速されることが期待されます。 SWIM サーバーは現在、SNP チップベースの代入のみをサポートしています。 低カバレッジのシーケンスベースの代入は、大規模な計算リソースを必要とするため、Web サーバーで対応するのがはるかに困難です。 それにもかかわらず、ユーザーは、私たちが共有するハプロタイプ参照パネルを使用して、低カバレッジのシーケンスベースの代入を実装することができます。

ハイスループットのジェノタイピングアレイによりジェノタイピングが大幅に簡素化され、多数の新しい QTL が、通常は品種内で、数百から数千の個体との関連マッピングによってマッピングされています6。 しかし、SNP アレイでは分解能が向上しましたが、SNP アレイはアッセイの実現可能性、均一な間隔、および共通の SNP を優先しているため、原因遺伝子と変異は依然として非常にとらえどころがありません 5。

私たちの評価では、Shapeit4/Impute5 が他のソフトウェアの組み合わせよりも優れており、SNP チップの密度が高いため代入精度が高く、サンプルサイズを最大化する多品種ハプロタイプ参照パネルが好ましいことが示されました。 重要なのは、ハプロタイプ参照パネルに遺伝的に近い動物をより高い精度で代入できることです。 これは、ハプロタイプ参照パネルでの表現を増やすためのデータ共有の重要性をさらに強化します。

上記の例で示したように、インピューテーションは遺伝子マッピングの解像度を大幅に向上させることが期待されます。 ブタにおける既存のゲノムワイド関連研究が多数存在することを考慮すると、このリソースが高度に活用され、影響力を持つことが期待されます。 実際、サーバーが公開されてから最初の 1 年で 130,000 を超えるゲノムが代入されました。これには、SWIM 代入ゲノムが他のプラットフォームと比較してより重要な SNP を検出することが判明した最近の研究も含まれます 28。 SNP アレイを使用した既存の研究はすべて、追加データなしで単純な代入とそれに続く GWAS によって改善できます。 共通のSNPセットが得られるためメタアナリシスも可能となります。 それにもかかわらず、遺伝子マッピングの解像度は、SNP 密度だけでなく、マッピング集団の実験デザインと遺伝子構造にも依存します。 配列レベルの代入では、必ずしも 1 つのステップで原因となる変異を特定できるわけではありません 16。 このリソースが利用可能であれば、マッピング研究の適切な設計が可能になり、特定の状況下で可能な限り最高の解像度を達成し、場合によってはヌクレオチドの解像度を達成することができます。

複数のソースからの WGS データを統合しました。 この研究では、150 bp ペアエンド リードを持つ Illumina (n = 863) および BGI (n = 667) プラットフォームを使用して、合計 1,530 匹の動物が最初に報告されています。 このうち、ランドレース 610 頭、デュロック 413 頭、ヨークシャー 391 頭、タイワンヘイ 18 頭、リチャヘイ 17 頭はウェンズ・フード・グループ株式会社(中国広東省雲浮市)からのもので、大華白 21 頭、ランタンヘイ 21 頭、広東小爾花 20 頭、ユエドンヘイ 19 頭はウェンズ・フード・グループ株式会社(中国広東省雲浮市)からのものでした。広東家畜家禽遺伝子銀行(中国広東省広州市)。 さらに、729 匹の動物の配列をシーケンス リード アーカイブ (SRA) からダウンロードしました。 アクセッション番号、サンプルサイズ、平均配列カバー率などの完全な内訳は、補足データ 1 および 2 にあります。

BWA-MEM-0.7.1730 を使用してシーケンスリードをブタ参照ゲノム (Sscrofa11.1、Duroc ブタ)29 にアライメントし、以下のようないくつかのポストアライメント処理ステップの後、GATK-4.1.8.1 HaplotypeCaller31 を使用してバリアント (GVCF 形式) を呼び出しました。 PicardTools-2.23.331 を使用した重複の削除と、GATK を使用した基本品質の再調整。 母集団 VCF は、すべてのサンプルにわたる GVCF を結合することによって生成されました。 過度のヘテロ接合性 (「ExcessHet > 54.69」) を持つバリアントは削除されました。 SNP のバリアント品質スコア再キャリブレーション (VQSR) は、イルミナ プラットフォーム上の 50K、60K、および 80K SNP チップ (以前 = 15.0) および 660K (以前 = 12.0)、SowPro90 (以前 = 15.0) Affymetrix プラットフォームの SNP チップ。 SNP は、99.0 の真実感度フィルター レベルでフィルターされました。 インデルの真理値集合がない場合、GATK のベスト プラクティスで推奨されているように、QD < 2.0、QUAL < 50.0、FS > 100.0、ReadPosRankSum < −20.0 のインデルを除外することでハード フィルターを適用しました。 さらに、欠損率 > 0.20、ヘテロ接合性 > 0.20 の動物をフィルターで除外し、欠損率 < 0.2、平均配列深度 5 ~ 500 の両対立遺伝子部位を保持しました。 フィルター処理は、VCFtools 0.1.1332 とBCFtools 1.1333 コマンド。

連鎖不均衡は、近親者 (GRM > 0.5) および低頻度変異体 (MAF < 0.05) を除去した後、同じ品種内の個体に対して PopLDdecay34 を使用して計算されました。 集団の遺伝構造を理解するために、MAF > 0.05、欠損率 <0.1 のバリアントを保持し、PLINK 1.935 を使用して LD (r2 < 0.3、-indep-pairwise 50 10 0.3) で SNP を枝刈りました。 主成分分析 (PCA) は、すべての個人に対して GCTA 1.93.236 を使用して、1,223,882 個のバリアントのフィルタリングされたリストに対して実行されました。 祖先は、データセット内の品種表現に従ってランダムに選択された 185 人の個体、または品種ごとに少なくとも 4 人の個体に対して ADMIXTURE 1.337 を使用して推定されました。 ダウンサンプリングは、母集団構造を適切に視覚化するために必要でした。

参照集団のハプロタイプを段階的に決定する前に、バリアントをさらにフィルタリングしました。 欠損率 > 0.1 および MAF < 0.005 のバリアントは削除されました。 さらに、デュロック豚、ランドレース豚、ヨークシャー豚の 3 頭すべてで PLINK に個別に実装されたハーディ・ワインバーグ平衡検定 P 値 < 10−10 のバリアントは削除されました。 常染色体変異のみが代入のために保持されました。

最も高いシーケンス深度(17.42 X 平均シーケンス深度、14.98 ~ 63.11 X の範囲)を持つ 100 頭のランドレース豚を抽出し、これらの個体を代入精度を評価するターゲット集団として指定しました。 参照集団の品種構成の影響をテストするために、すべて (n = 2159) を含む異なる個体セットを使用して 4 つの参照ハプロタイプ パネルを構築しました。 L (n = 550): 在来種豚のみ。 DLY (n = 550): ランドレース 250 頭 + デュロック 150 頭 + ヨークシャー 150 頭; LO (n = 550): 250 頭の在来種 + 300 頭のデュロックとヨークシャー以外のランダムに選択された豚。 フェージングは​​、これらのリファレンス セットで独立して実行されました。 さらに、SRA の 1006 人の個人から構築された参照ハプロタイプを含む PHARP Web サーバー (http://alphaindex.zju.edu.cn/PHARP/index.php) を使用して補完もテストしました。

SHAPEIT 4.238 + IMPUTE5 1.1.539、Beagle 5.240 + Beagle 5.2、および Eagle 2.441 + Minimac 442 を含む、フェーズとインピュテーションのためのソフトウェアの 3 つの組み合わせをテストしました。すべてのソフトウェア ツールは、デフォルトのオプションと有益でないリンケージ マップ (1 つあたり 1 cM) で実行されました。 1 Mb) ですが、有効母集団サイズは 100 に設定されました。帰属遺伝子型は、事後遺伝子型確率が最も高いものによって呼び出されます。 ただし、代入 Web サーバーのユーザーは遺伝子型確率も受け取ります。

私たちは、代入精度、一致率、非参照一致率 43、r2 という 3 つの一般的に使用される指標を検討しました。 一致率は、観察された遺伝子型と一致する帰属遺伝子型を持つ個人の割合として定義されます。 非参照一致率は一致率に似ていますが、参照対立遺伝子に対してホモ接合性ではない個人のみに限定されます。 r2 は、観察された遺伝子型と推定された遺伝子型の間の二乗ピアソン相関係数です。 SNP ごとに一致率と r2 を測定し、MAF ビン内の SNP またはゲノム全体にわたってそれらを平均しました。

遺伝子マッピングにおけるインピューテーションの有用性を実証するために、我々は、Wen's Food Group Co., Ltd. (中国広東省雲浮市) の 3 つの中核繁殖農場で管理されている 3 つの豚集団の表現型と遺伝子型を収集しました。これらはすべて標準的な管理下にあります。実践。 背脂肪の厚さについては、2013 年から 2018 年にかけて 3769 頭のデュロック豚の表現型が収集され、Geneseek GGP Porcine 50K SNP チップ (Neogen、リンカーン、ネブラスカ州、米国) を使用して SNP 遺伝子型決定が行われました。 豚の生体重が約 100 kg (100 ± 5 kg) に達したときに、Aloka 500 V SSD B 超音波 (Corometrics Medical Systems、米国) を使用して、10 番目と 11 番目の肋骨の間の背脂肪の厚さを測定しました。 体長については、2012 年から 2018 年までに合計 1694 頭のヨークシャーイノシシから表現型が収集され、Affymetrix PorcineWens55K SNP チップ (Affymetrix、サンタクララ、カリフォルニア州、米国) を使用して SNP 遺伝子型解析が実行されました。 体長は、体重約 100 kg (100 ± 5 kg) のブタの耳の付け根から尾の付け根まで測定しました。 すべてのサンプルは、中華人民共和国農業農村省によって承認された実験動物の管理と使用に関するガイドラインに従って収集されました。 華南農業大学の倫理委員会は、この研究における動物の使用を特に承認した。

GCTA 1.92.1 を使用して、混合線形モデル (MLM) ベースの関連分析を実行しました。 次の統計モデルが使用されました: \(y=\mu +{xb}+g+e\) (式 1)、ここで y はすべての動物の表現型値のベクトル、\(\mu\) は切片です、 \(x\) は、遺伝子型とその他の固定効果の発生率をコーディングする計画行列です。 \(b\) は、SNP 効果と、形質に応じた性別、ペン、年と季節の効果などの追加の共変量を含む固定効果のベクトルです。 、 \(g\) はゲノム関係行列によって決定される共分散を伴う多遺伝子変量効果のベクトル、 \(e\) はランダム残差のベクトルです。 GeneSeek GGP 50 K SNP チップ (背脂肪の厚さ用) および Affymetrix Wens 55K SNP チップ (体長用) の SNP を使用して、ゲノム関係行列を計算しました。 有意性を宣言するために、ゲノム全体の有意性閾値 P = 5 × 10−8 を使用しました。 単一の有意な SNP によって説明される分散は、単一の SNP によって決定されたゲノム関係行列を使用して混合線形モデルをフィッティングすることによって推定されました。

すべての統計分析は、説明されているソフトウェア パッケージまたは R 4.2.2 のいずれかを使用して実行されます。 当社は、GitHub (https://github.com/qgg-lab/swim-public) および Zenodo リポジトリ 44 (https://doi.org/10.5281/zenodo.7900470) で図を生成するスクリプトを含むすべてのスクリプトを提供しています。 )。 SWIM ハプロタイプ参照パネル全体のサンプル サイズは 2259 で、特定の質問に答えるためにさまざまなデザインに対してサブセットが選択されています。 背脂肪の厚さと体長 GWAS のサンプル サイズは、それぞれ 3769 と 1694 でした。

研究デザインの詳細については、この記事にリンクされている Nature Portfolio Reporting Summary を参照してください。

512 匹の動物の生の配列データが SRA に寄託されました (PRJNA842867)。 追加の配列決定された動物は、Wen's Food Group Co., Ltd. および広東家畜家禽遺伝子銀行の専有財産でした。 これらは、それぞれ[email protected]および[email protected]に連絡することでリクエストできます。 この研究で利用された動物のサブセット (n = 729) の生の配列データは SRA からダウンロードされました (補足データ 1 および 2)。 完全なデータセットを利用した代入は Web サービス (https://www.swimgeno.org および https://swim.scau.pigselection.com/swim) として提供され、一般に利用できます。 この研究 (n = 1241) を含む、公的に入手可能なすべての個人の段階的ハプロタイプは、https://quantgenet.msu.edu/swim/statistics.php で VCF ファイルとして入手できます。 図の基礎となるソースデータ。 1a、b、2、3、4、および 6c は、それぞれ補足データ 7、8、9、10、11、および 12 で提供されます。

この研究で実行されたすべての分析と SWIM Web サーバーのコードを含むすべてのコンピューター コードは、https://github.com/qgg-lab/swim-public および Zenodo リポジトリ 44 (https://doi.org) で入手できます。 /10.5281/zenodo.7900470)。

ラニー、JK 他ヒト生物医学モデルとしてのブタの重要性。 科学。 翻訳。 医学。 13、eabd5758 (2021)。

論文 CAS PubMed Google Scholar

グローネン、MAM et al. ブタのゲノムを分析すると、ブタの人口統計と進化についての洞察が得られます。 ネイチャー 491、393–398 (2012)。

論文 CAS PubMed PubMed Central Google Scholar

リー、M.ら。 ゲノム分析により、家畜化されたブタとチベット野生イノシシにおける異なる選択パターンが特定されました。 ナット。 ジュネット。 45、1431–1438 (2013)。

論文 CAS PubMed Google Scholar

ボッセ、M.ら。 ゲノム分析により、ヒト媒介遺伝子移入後のヨーロッパ豚におけるアジア系遺伝子の選択が明らかになりました。 ナット。 共通。 5、4392 (2014)。

論文 CAS PubMed Google Scholar

ラモス、AM et al. 次世代シーケンス技術によって同定および特徴付けられた SNP を使用した、ブタにおける高密度 SNP ジェノタイピング アッセイの設計。 PLoS ONE 4、e6524 (2009)。

記事 PubMed PubMed Central Google Scholar

Hu, Z.-L.、カリフォルニア州パーク & Reecy, JM Animal QTLdb と CorrDB の統合開発を通じて家畜の遺伝およびゲノム情報の知識ベースを構築。 核酸研究所 47、D701–D710 (2019)。

論文 CAS PubMed Google Scholar

オンテル、SK 他ブタの残留飼料摂取と関連形質の全ゲノム関連研究。 PLoS ONE 8、e61756 (2013)。

論文 CAS PubMed PubMed Central Google Scholar

Sell-Kubiak、E. et al. ゲノムワイド関連研究により、大型白豚集団における同腹子の数とその変動性の新規遺伝子座が明らかになりました。 BMC ゲノミクス 16、1049 (2015)。

論文 CAS PubMed PubMed Central Google Scholar

ニュージャージー州ボディッカーら。 ブタ生殖・呼吸器症候群ウイルス感染に対する宿主反応のゲノムワイドな関連性とゲノム予測。 ジュネット。 セル。 進化。 46、18 (2014)。

記事 PubMed PubMed Central Google Scholar

Marchini, J. & Howie, B. ゲノムワイド関連研究のための遺伝子型補完。 ナット。 ジュネ牧師。 11、499–511 (2010)。

論文 CAS PubMed Google Scholar

Das, S. et al. 次世代の遺伝子型補完サービスと手法。 ナット。 Genet.48、1284–1287 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

Daetwyler、HD et al. 234 頭の雄牛の全ゲノム配列決定により、牛の単一遺伝子形質と複雑形質のマッピングが容易になります。 ナット。 ジュネット。 46、858–865 (2014)。

論文 CAS PubMed Google Scholar

van den Berg, S. et al. 複数のブタ集団を使用した全ゲノム配列への代入と、ゲノムワイド関連研究におけるその使用。 ジュネット。 セル。 進化。 51、2 (2019)。

記事 PubMed PubMed Central Google Scholar

ヤン、W.ら。 Animal-ImputeDB: 遺伝子型補完のための複数の動物参照パネルを備えた包括的なデータベース。 核酸研究所 48、D659–D667 (2020)。

論文 PubMed Google Scholar

Wang、Z.ら。 PHARP: 遺伝子型補完のためのブタのハプロタイプ参照パネル。 科学。 議員第 12 号、12645 (2022)。

論文 CAS PubMed PubMed Central Google Scholar

ヤン、G.ら。 代入された全ゲノム配列に基づく GWAS アプローチは、特定のブタ集団における複雑な形質の原因となる突然変異を正確に特定します。 科学。 中国生命科学。 65、781–794 (2022)。

論文 CAS PubMed Google Scholar

Ros-Freixedes、R. et al. 厳選されたブタ系統の全ゲノム配列データによるゲノム予測。 ジュネット。 セル。 進化。 54、65 (2022)。

論文 CAS PubMed PubMed Central Google Scholar

テネシー州ローワンら。 複数品種の参照パネルと追加の希少変異体により、牛の補完精度が最大化されます。 ジュネット。 セル。 進化。 51、77 (2019)。

論文 CAS PubMed PubMed Central Google Scholar

Nezer, C. et al. 筋肉量と脂肪沈着に大きな影響を与えるインプリントされた QTL は、ブタの IGF2 遺伝子座にマッピングされます。 ナット。 ジュネット。 21、155–156 (1999)。

論文 CAS PubMed Google Scholar

ヴァン・レア、A.-S. 他。 IGF2 の調節変異は、ブタの筋肉成長に大きな QTL 効果を引き起こします。 Nature 425、832–836 (2003)。

論文 PubMed Google Scholar

Kim, KS、Larsen, N.、Short, T.、Plastow, G. & Rothschild, MF ブタメラノコルチン 4 受容体 (MC4R) 遺伝子のミスセンス変異体は、肥満、成長、飼料摂取形質と関連しています。 マム。 ゲノム 11、131–135 (2000)。

論文 CAS PubMed Google Scholar

OVilo、C.ら。 ブタ 6 番染色体上の体組成の位置候補遺伝子をテストします。Genet。 セル。 進化。 34、465–479 (2002)。

論文 PubMed Google Scholar

Gozalo-Marcilla、M. et al. 多様な遺伝的背景を持つ豚系統における背脂肪の厚さに関する遺伝的構造と主要な遺伝子。 ジュネット。 セル。 進化。 53、76 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

IS ファルーキら。 メラノコルチン 4 受容体欠損症に関連する病的肥満の優性および劣性遺伝。 J.クリン. 投資する。 106、271–279 (2000)。

論文 CAS PubMed PubMed Central Google Scholar

Krashes、MJ、Lowell、BB、Garfield、AS メラノコルチン 4 受容体によって調節されるエネルギー恒常性。 ナット。 神経科学。 19、206–219 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

リー、J.ら。 ブタの枝肉の長さに関連するBMP2遺伝子の上流の調節変異の同定と検証。 ジュネット。 セル。 進化。 53、94 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Whalen, A. & Hickey, JM AlphaImpute2: 家畜集団の数十万個体に対する、血統と集団に基づく高速かつ正確な代入。 bioRxiv https://doi.org/10.1101/2020.09.16.299677 (2020) でプレプリント。

サン、J.ら。 ヨークシャー豚の代入ベースの全ゲノム配列データを使用した生殖形質に関するゲノムワイド関連研究。 遺伝子 14、861 (2023)。

論文 CAS PubMed PubMed Central Google Scholar

ウォー、A.ら。 ブタの遺伝学およびゲノム研究を可能にする改良されたブタ参照ゲノム配列。 ギガサイエンス 9、giaa051 (2020)。

記事 PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Burrows-Wheeler 変換による高速かつ正確なショートリード アライメント。 バイオインフォマティクス 25、1754–1760 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

マサチューセッツ州デプリストら。 次世代 DNA シーケンス データを使用した変異発見とジェノタイピングのためのフレームワーク。 ナット。 ジュネット。 43、491–498 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

Danecek、P. et al. バリアント呼び出しフォーマットと VCFtools。 バイオインフォマティクス 27、2156–2158 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

Danecek、P. et al. SAMtools と BCFtools の 12 年間。 ギガサイエンス 10、giab008 (2021)。

記事 PubMed PubMed Central Google Scholar

Zhang、C.、Dong、S.-S.、Xu、J.-Y.、He、W.-M. & ヤン、T.-L. PopLDdecay: バリアント コール フォーマット ファイルに基づいた連鎖不平衡減衰解析のための高速かつ効果的なツールです。 バイオインフォマティクス 35、1786–1788 (2019)。

論文 CAS PubMed Google Scholar

チャン、CCら。 第 2 世代の PLINK: より大規模で豊富なデータセットへの挑戦。 ギガサイエンス 4、7 (2015)。

記事 PubMed PubMed Central Google Scholar

Yang, J.、Lee, SH、Goddard, ME & Visscher, PM GCTA: ゲノム全体にわたる複雑な形質分析のためのツール。 午前。 J. ハム。 ジュネット。 88、76–82 (2011)。

論文 CAS PubMed PubMed Central Google Scholar

Alexander, DH、November, J. & Lange, K. 無関係な個人における祖先の高速モデルベース推定。 ゲノム研究所 19、1655–1664 (2009)。

論文 CAS PubMed PubMed Central Google Scholar

Delaneau, O.、Zagury, J.-F.、Robinson, MR、Marchini, JL & Dermitzakis, ET 正確でスケーラブルかつ統合的なハプロタイプ推定。 ナット。 共通。 10、5436 (2019)。

記事 PubMed PubMed Central Google Scholar

Rubinacci, S.、Delaneau, O. & Marchini, J. Positional Burrows Wheeler Transform を使用した遺伝子型補完。 PLoS ジュネット。 16、e1009049 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

Browning, BL、Tian, X.、Zhou, Y. & Browning, SR 大規模シーケンス データの高速 2 段階フェージング。 午前。 J. ハム。 ジュネット。 108、1880–1890 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

ペンシルベニア州ロー、PF パラマラ、アラバマ州プライス 英国バイオバンク コホートにおける高速かつ正確な長距離フェージング。 ナット。 ジュネット。 48、811–816 (2016)。

論文 CAS PubMed PubMed Central Google Scholar

Howie, B.、Fuchsberger, C.、Stephens, M.、Marchini, J. & Abecasis, GR プレフェーズによるゲノムワイド関連研究における迅速かつ正確な遺伝子型代入。 ナット。 ジュネット。 44、955–959 (2012)。

論文 CAS PubMed PubMed Central Google Scholar

Li、JH、Mazur、CA、Berisa、T. & Pickrell、JK ローパスシーケンシングは、ジェノタイピングアレイと比較して GWAS の検出力を高め、多遺伝子リスクスコアの測定誤差を減少させます。 ゲノム研究所 31、529–537 (2021)。

記事 PubMed PubMed Central Google Scholar

qgg-lab. qgg-lab/swim-public: swim-public-v1。 ゼノド。 https://doi.org/10.5281/zenodo.7900470 (2023)。

リファレンスをダウンロードする

この研究は、USDA-NIFA プロジェクト (WH、CG、JS、および R.Sc. への 2021-67021-34149)、USDA-NIFA ハッチ プロジェクト (WH への MICL 02560)、中国自然科学財団プロジェクトによってサポートされています。 (31972540 to JY)、広東省自然科学財団プロジェクト (2018B030313011 to ZW)、および広東省の主要技術研究開発プログラム (2022B0202090002 to ZW)。 Web サーバー (https://www.swimgeno.org) は、USDA Swine Genome Coordinator Fund (NRSP8) によってサポートされています。

ロドリゴ・サベニャーゴ

現在の住所: Genus IntelliGen Technologies、米国ウィスコンシン州デフォレスト

タン・スシュウ

現在の住所:中国山東省青島市青島大学生命科学部

中国広東省広州市華南農業大学動物科学・国家工学部繁殖養豚産業研究センター

Rongrong Ding、Gengyuan Cai、Zhanwei Zhuang、Jie Wu、Ming Yang、Yibin Qiu、Donglin Ruan、Jianping Quan、Enqin Zheng、Huaqiang Yang、Zicong Li、Jie Yang、Zhenfang Wu

米国ミシガン州イーストランシングのミシガン州立大学動物科学部

Rongrong Ding、Rodrigo Savegnago、Jinding Liu、Jianping Quan、Suxu Tan、Mohammed Bedhane、Juan Steibel、Cedric Gondro、Wen Huang

中国広東省由布市、嶺南現代農業広東研究所雲府サブセンター

Rongrong Ding、Cheng Tan、Zhenfang Wu

高度学際研究院、南京農業大学、中国江蘇省南京

ジンディン・リウ

ミシガン州立大学サイバーイネーブルド研究研究所(米国ミシガン州イーストランシング)

ナニエ・ロング

広東中信繁殖技術有限公司、中国広東省広州市

チェン・タン&ゲンユアン・サイ

広東省農業動物ゲノミクスおよび分子育種重点研究所、華南農業大学、広州、広東省、中国

リー・ジコン&ヤン・ジエ

米国ミズーリ州コロンビア、ミズーリ大学動物科学部

ロバート・シュナーベル

米国ミシガン州イーストランシングのミシガン州立大学水産野生生物学部

フアン・スタイベル

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

WH、ZW、JY、RD: 概念化と設計。 RD、R.Sa.、NL、WH: 開発および最適化されたパイプライン。 RD、ST、MB: 分析データ。 JL と WH: 開発された Web サーバー。 R.Sc.、CT、GC、ZZ、JW、MY、YQ、DR、JQ、EZ、HY、ZL、JS、CG: 提供されたツールとデータ。 RD と WH: 著者全員からの意見をもとに論文を執筆しました。

Jie Yang、Wen Huang、または Zhenfang Wu に相当します。

CT と GC は、Guangdong Zhongxin Breeding Technology Co., Ltd. の従業員です。他の著者はすべて、競合する利益を宣言していません。

Communications Biology は、この研究の査読に貢献してくれた匿名の査読者に感謝します。 主な担当編集者: George Inglis。 査読ファイルが利用可能です。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Ding, R.、Savegnago, R.、Liu, J. 他 SWine IMputation (SWIM) ハプロタイプ参照パネルは、ブタにおけるヌクレオチド分解能の遺伝子マッピングを可能にします。 Commun Biol 6、577 (2023)。 https://doi.org/10.1038/s42003-023-04933-9

引用をダウンロード

受信日: 2022 年 11 月 24 日

受理日: 2023 年 5 月 12 日

公開日: 2023 年 5 月 30 日

DOI: https://doi.org/10.1038/s42003-023-04933-9

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。