منظور از ژنوم تمامی ماده ژنتیکی موجود در بدن یک موجود زنده است. ژنوم انسان نیز که شامل دی اِن اِی، هسته و
میتوکندری است و دستورالعملهای وراثتی را در خود دارد تقریباً در همه انسان ها یکسان است اما بخش کوچکی از دی اِن اِی در افراد مختلف با هم فرق دارد. مقدار قابل ملاحظهای از ماده ژنتیکی انسان طول زیادی دارد و شامل قطعه هایی است که دوباره و دوباره تکرار میشوند. علیرغم اینکه ژنوم هر انسانی قطعههای تکرار شونده دارد، تعداد آنها در همه افراد یکسان نیست. تنوع ژنتیکی انسانها بسیار زیاد است و در حقیقت همین تفاوت در تعداد قطعات تکرار شونده است که این تنوع را پدید میآورد.
نقشه ژنوم انسان دو دهه پیش، بین سال های ۱۹۹۰ و ۲۰۰۳ برای نخستین بار پس از یک همکاری بینالمللی در پروژهای به نام «پروژه ژنوم انسان» منتشر شد اما نقشه کاملی نبود چون حدود ۸ درصد از دی اِن اِی، توالی یابی نشده باقی ماند. دلیل آن وجود قطعههای تکرار شوندهای بود که به سختی با بقیه قطعهها ترکیب می شدند.
توالی یابی ژنوم مانند این است که ابتدا صفحههای یک کتاب را ببُریم و به تکههای بسیار کوچک تبدیل کنیم، سپس برای بازسازی کتاب دوباره آن خردههای متن را کنار هم گذاشته و به هم وصل کنیم. بخش هایی از متن که دارای تعداد زیادی کلمات و عبارتهای تکرار شونده هستند را سختتر از بندهایی که کلمات غیر تکراری و خاص دارند میتوانیم در محل درست خودشان قرار داده و کنار هم منظم کنیم.
نقشه ارائه شده، اطلاعاتی از ناحیهای از ژنوم انسان به نام «یوکروماتین» (Euchromatin) داشت؛ ناحیهای که در آن دی اِن اِی پروتئین را رمزنویسی می کند و در کروموزومِ آن مقادیر فراوانی ژن وجود دارد. ۸ درصدی که توالییابی نشد در بخشی بود که «هتروکروماتین» نام دارد؛ یعنی بخش کوچکی از ژنوم که پروتئین سازی نمیکند.
بار دیگر یک پروژه مشارکتی جهانی با همکاری بیش از ۱۰۰ دانشمند از ارگان های علمی و دانشگاه ها شکل گرفت تا قطعههای گم شده ژنوم اولیه انسان شناسایی شوند و در محلهای خالی قرار گیرند. این پروژه، «کنسرسیوم تلومر به تلومر» (T2T) نام دارد و یکی از یافتههای قابل توجه آن پی بردن به اهمیت همان
قطعه های تکرار شونده است. انگیزه این نامگذاری وجود تلومرهایی (پایانه فیزیکی کروموزوم های خطی) است که نقاط انتهایی همه کروموزومها را میپوشانند.
توالییابی کامل ژنوم انسان مستلزم ابداع شیوه های جدید توالییابی دی اِن اِی و تحلیلهای محاسباتی بود. به علاوه، تیمی از دانشمندان ممتاز باید گرد هم میآمدند تا خوانش ۸ درصد از ژنوم انسان را که از لحاظ ساختاری بسیار پیچیده و تکراری بود را کامل کنند. ۸ درصد باقی مانده ژن ها و مناطق تکرار شونده متعددی را شامل میشد. بیشتر توالی هایی که به تازگی اضافه شدند نزدیک به تلومرها (رأسهای بلند و دنبالهدار کروموزم) و سانترومرهای (بخش متراکم میانی کروموزم) تکرار شونده بودند.
این اقدام از ۲۰ سال پیش تا کنون معلق مانده بود، اما انتظار بیثمر نبود چون اکنون آرایهای غنی از ویژگیهای حیرتانگیز ساختار ژنوم کشف شده است که در درک بهتر تکامل، تنوع ژنومی و عملکرد بیولوژیکی انسان بسیار تأثیر گذار است.
در پروژه ژنوم انسان برای یافتن محل خالی قطعهها از فناوری «خوانده کوچک» (short-read) استفاده شد که ۲۰ سال پیش تنها فناوری موجود برای نقشهبرداری از ژنوم بود. با این فناوری در یک زمان واحد فقط امکان خوانش چیزی معادل چند کلمه از کد ژنتیکی میسر بود. برای مثال، قطعه ای از ژنوم را تصور کنیم که شامل جمله «طبیعت آنها را نابود می کند تا جایی برای دیگران باز نماید» است و نُه مرتبه در یک ردیف تکرار میشود. فناوری خوانش کوچک در هر نوبت فقط بخشهایی از این جمله را آشکار میکند؛ مثل طبیعت آنها، برای دیگران، تا جایی و غیره. دانشمندان با قرار دادن این تکههای کوچک به جمله کامل میرسیدند اما به هیچ طریقی نمیتوانستند از این که جمله ۹ بار تکرار شده آگاه شوند.
در عوض، در پروژه T2Tابزارهای بهتری در اختیار آنها قرار گرفت. فناوری جدید که توالییابی خوانش طولانی (long-read)است میتواند در آنِ واحد تمامی اجزای جمله حتی پاراگرافها را به طور کامل بخواند. اینگونه بود که مشاهده تکههای بزرگ و حتی تمامی یک قطعه توالی تکرار شونده نیز امکانپذیر شد. ایجاد یک جمله از ژنوم انسان که به معنای واقعی فاقد فضای خالی باشد گامی بزرگ به حساب میآید. خیلی خوب میشد اگر این موفقیت ۲۰ سال پیش به دست میآمد، اما لازمه آن پیشرفت فناوری بود. این منبع توالی اکنون محکم و کامل و عاری از شکاف و نقص است و به درک بیولوژی انسان کمک شایانی میکند، چون دیگر هیچ تکه گم شدهای در آن وجود ندارد.
یکی از اقدامات ارزنده دانشمندان در سالهای گذشته گردآوری مجموعهای از قطعههای تکراری در ژنوم بود. آنها دریافتند که این قطعهها دارای عناصر متحرک، ویروسها و تکرارهای جدیدی هستند که تا آن روز شناسایی نشده بودند. عناصر متحرک این توانایی را دارند که از یک قسمت از ژنوم به قسمت دیگر آن پرش کنند. مثال کلاسیک این پرشها ژنهای جهندهای هستند که موجب تغییر رنگ دانههای ذرت برای مثال از قرمز به سفید میشوند. برخی از قطعههای تکراری جدید نیز حامل ژن شناسایی شدهاند. بعضی از قطعههای تکرار شونده بزرگ که از هر کدام آنها ۱۰، ۲۰ یا ۳۰ نسخه وجود دارد به دنبال هم تکرار میشوند و حاوی ژنهایی هستند که در تنوع انسانها نقش زیادی دارند. در جمله مثال زده شده اگر واژه طبیعت را یک ژن در نظر بگیریم، این امکان وجود دارد که یک فرد پنج نسخه از آن را داشته باشد و فردی دیگر ۲۵ نسخه.
در پروژه T2Tبرای نخستینبار، جملات کامل بخشهای مرکزی هر کروموزم انسانی یا همان سنترومرها مشاهده شدند. سنترومرها دو بازوی هر کروموزوم را که به شکل Xاست به هم متصل میکنند. سنترومرها دارای عناصر متحرک شناخته شده و تکرارهای تازه هستند. به نظر میرسد بخش زیادی از دی اِن اِی درون سنترومر برای حفظ اطلاعات ژنتیکی سلول طی نسلهای مختلف لازم باشد. پیشتر نقش سنترومرها در همانندسازی دی اِن اِی به هنگام تکثیر سلولی به اثبات رسیده است. اگر آنها موقعیت خود را روی کروموزوم به طرز بارزی تغییر دهند، باید منتظر ظهور گونههای کاملاً جدیدی باشیم. جملات کامل سنترومری و بدون فضاهای خالی که طی پروژه T2Tساخته شدند، شناخت دانشمندان از سنترومرها و وظیفهشان را گستردهتر میکنند.
توالیهای دی اِن اِی جدید جزئیاتی از ناحیه پیرامون سنترومر را آشکار میکنند که پیش از این شناخته شده نبودند. ناحیه اطراف سنترومر جایی است که کروموزومها طی تقسیم سلولی به تصرف در میآیند و دو تکه میشوند. توالیهای جدیدی که درون و پیرامون سنترومر شناسایی شدهاند حدود ۲ر۶ درصد از کل ژنوم را که تقریباً معادل ۱۹۰ میلیون جفت باز یا نوکلئوتید است تشکیل میدهند. بیشتر توالیهای افزوده شده دیگر، در اطراف تلومرهای پایانه هر کروموزوم و نیز در نواحی در برگیرنده ژنهای ریبوزومی یافت میشوند. کل ژنوم فقط از چهار نوع نوکلئوتید ساخته شده است که در گروههای سهتایی آمینواسیدهای سازنده پروتئینها را رمزنگاری میکنند.
به کمک توالیهای جدید میتوان اطمینان حاصل کرد که هر سلول دختر تعداد درستی از کروموزوم ها را به ارث میبرد. متغیر و متنوع بودن این ناحیه نیز گواه این است که چگونه اجداد بشر امروزی در آفریقا به تکامل رسیدند.
ژنوم تکمیل شده، T2T-CHM13نام گرفته و نشان دهنده به روزرسانی چشمگیر مرجع ژنومی کنونی، یعنی GRCh38 است. پزشکها زمانی که به دنبال یافتن جهشهای مرتبط با بیماریها هستند از مرجع فعلی استفاده میکنند. دانشمندان نیز به کمک آن تکامل تنوع ژنتیکی انسان را مورد مطالعه قرار میدهند. اگر توالییابی دی اِن اِی را به چیدن تکههای یک پازل تشبیه کنیم، ژنوم مرجع مانند تصویر کامل پازل روی جعبه آن است که کمک میکند تکهها را در جای مناسب خودشان قرار دهیم.
نسخه کامل ژنوم که همه ۲۲ اتوزوم (کروموزوم های غیر جنسی) و کروموزوم جنسی X را شامل میشود متشکل از ۰۵۵ر۳ میلیارد جفتِ باز و ۱۹ هزار و ۹۶۹ ژن است. جفتهای باز، دو نوکلئوتید با ترکیبات مکمل مخالف روی رشتههای آر اِن اِی و دی اِن ای و به بیانی روشنتر، واحدهای سازنده کروموزوم ها و ژن های ما هستند. ژنها نیز پروتئینها را رمزنگاری میکنند که از میان آنها ۲۰۰۰ ژن جدید شناسایی شدهاند و بیشترشان غیر فعال هستند؛ اگر چه ۱۱۵ ژن ممکن است قابلیت بیان شدن داشته باشند.
تکمیل پروژه توالییابی تنها با کار روی یک ژنوم انسانی صورت گرفت که متعلق به توموری غیر سرطانی به نام «مول هیداتی فرم» بود. شاید این اسم خیلی پیچیده به نظر برسد اما بسیاری از ما نام دیگر آن که «بچه خوره» است را شنیدهایم؛ بیماری نادری که ناشی از نقص ژنتیکی در تخم بارور شده است. این تومور خوشخیم در اصل جنین انسان است که دی اِن اِی مادر را پس زده و به جای آن دی اِن اِی پدر را همانندسازی میکند. جنینهایی این چنینی میمیرند و تبدیل به تومور میشوند. با توجه به اینکه این مول به طور خاص دو نسخه مشابه از دی اِن اِی پدری را داشت و هر دو کروموزوم X پدر را داشتند، توالییابی آن آسانتر بود.
در پژوهشهای آتی ژنتیک انسان، ژنومی که اکنون به طور کامل توالییابی شده میتواند سکوی پرتابی برای شناسایی مناطق جالب توجه دی اِن اِی انسان باشد. برای مثال، در فازهای بعدی ژنوم افراد بسیاری توالییابی خواهد شد تا اطلاعات کاملاً شفافی از تنوع انسانی، بیماریها و ارتباط گونه انسان با نزدیکترین خویشاوندش به دست آید.
***
سانترومر، موضوع داغ زیست شناسی
حدود ۹۰ درصد از توالی جدیدی که در ژنوم انسان شناسایی شده مربوط به سانترومرهای کروموزومها است. مطالعه روی نواحی سانترومری که از لحاظ ساختاری متمایز هستند و قطعههای طولانی دی اِن اِی تکرار شونده را در خود دارند کار آسانی نیست؛ به حدی که برخی زیست شناسهای با تجربه به مهندسهای ژنتیک جوان هشدار میدهند خود را درگیر مبحث سانترومر نکنند، چون اگر در آن وارد شوند دیگر راه خروج نخواهند داشت! با این حال، اکنون سانترومر به موضوع داغ دانش زیست شناسی تبدیل شده است. یکی از اسرار سانترومرها این است که مدام در یک محل شکل میگیرند؛ دانشمندان به دنبال چرایی و چگونگی این عملکرد در سانترومرها هستند، چرا که هیچ کد ژنتیکی مشخصی برای این رفتار آنها وجود ندارد. یک پاسخ ممکن این است: آنها همان جایی هستند که باید باشند، چون از ابتدا، درون اسپرم و تخم نیز در جای ثابت خود بودهاند. با همه اینها، در موارد نادری سانترومرهای جدیدی ممکن است در نقاط دیگری از کروموزوم شکل بگیرند. به وجود آمدن سانترومر جدید باید به موازات غیر فعال شدن سانترومر قبلی صورت گیرد، چون کروموزومی که دو سانترومر فعال را به طور همزمان داشته باشد، در مرحله میتوز که مرحله تقسیم هسته سلول به دو هسته مشابه است، میشکند.
اهمیت فناوری های توالی یاب خوانده های طولانی
موفقیت کنسرسیوم تلومر به تلومر (T2T)در تکمیل توالییابی ژنوم انسان به دلیل وجود تکنیکهای ارتقاءیافته برای توالییابی قطعههای بلند دی اِن اِی در یک زمان واحد است. این تکنیکها همچنین به تعیین ترتیب قطعههای بسیار تکرار شونده دی اِن اِی کمک میکنند.
یکی از فناوریهای کارآمد توالییاب، HiFiاست که میتواند قطعههایی طولانی متشکل از ۲۰ هزار یا بیشتر جفت باز را با دقت زیاد خوانش کند. فناوری دیگر که از دستاوردهای دانشگاه آکسفورد است میتواند چندین میلیون جفت باز روی یک توالی را بخواند.
فناوریهایی از این دست علاوه بر اینکه در توالییابی قطعههای بلند و تکرار شونده دی اِن اِی مفید هستند، امکان توالییابی تک مولکولهای بلند دی اِن اِی را نیز فراهم میآورند.
دانشمندان قصد دارند با استفاده از یک تکنیک ارتقاء یافته، نقاطی از کروموزم را که به وسیله پروتئینها مقید
شده اند مشخص کنند، به همان شیوهای که یک ساختار پروتئینی به نام کینه توکور خود را به سانترومر متصل میکند.
کاربرد این تکنیک نیز مستلزم استفاده از فناوری توالییابی خوانده طولانی است.
code