دسته بندی ها
Search - Contacts
مقالات و اخبار
Search - News Feeds
واژه نامه
تگ ها

فهرست صفحات

مقالات ژنتیک
تغییر اندازه و نوع قلم متن

آیهوا لی و دیوید مه‌یر
دپارتمان اپیدمیولوژی و بیواستاتیستیک (آمار حیاتی)، دانشگاه مک‌مستر، همیلتون، کانادا
ترجمه دکتر رویا وکیلی

چکیده
با کاهش هزینۀ تعیین توالی و ظهور شرکت‌های ارائة خدمات تعیین توالی، این احتمال وجود دارد که توالی کل ژنوم افراد در نهایت تبدیل به یک ابزار رایج در حرفۀ پزشکی شود. ما این 3 بررسی مطالعاتی را برای کمک به پزشکان غیر متخصص در ژنتیک ارائه داده‌ایم تا برای پیشرفت‌های عمده‌ای که به احتمال زیاد در سال‌های آینده در زمینۀ پزشکی شخصی، که به سرعت در حال پیشرفت است، آماده باشند. مقالۀ نخست که اکنون پیش روی شماست بر مفاهیم اساسی ژنتیک مولکولی متمرکز شده است. ما به بررسی نحوۀ نوترکیبی در طول میوز، چگونگی ایجاد تغییرات ژنتیکی از جمله پُلی‌مورفیسم تک نوکلئوتیدی (SNP)، اضافات و حذفیات و چگونگی به ارث رسیدن آنها از نسلی به نسل دیگر پرداخته‌ایم. ما با شرح جزئیات به بررسی این نکته پرداخته‌ایم که چگونه نوع ژن می‌تواند در بیان و عملکرد پروتئین تأثیر بگذارد و ویژگی‌های اصلی ژنوم انسان را به‌طور خلاصه شرح داده‌ایم. علاوه بر این توضیح داده‌ایم که چگونه دستاوردهای پروژه‌های ژنوم انسانی ، پروژۀ HapMap، و اخیراً پروژۀ 1000 ژنوم، تشخیص انواع ژنتیکی منجر به بیماری‌های شایع در جمعیت انسانی را ارتقاء داده‌اند. مقالات دوم و سوم در مورد اپیدمیولوژی ژنتیک و کاربردهای بالینی در پزشکی شخصی هستند.

واژگان کلیدی: کروموزوم، اسید دئوکسی ریبونوکلئیک، نوع ژن، هاپلوتیپ، ژنوم انسان، عدم موازنه

مقدمه
اکثر بیماری‌های انسان یک جزء ژنتیکی دارند. پزشکان غیر متخصص در زمینۀ ژنتیک با بیماری‌های تک‌ژنی آشنایی دارند به این دلیل ساده که آموزش پزشکی، شامل دروس ژنتیک انسان، به ‌طور عمده به "بیماری‌های مندلی" اشاره می‌کند. یک مثال از اختلال تک‌ژنی، بیماری هاتنتیگتون است که توسط یک جهش منفرد در ژن HD ایجاد و این الگوی وراثت اتوزمال به راحتی در تمامی نسل‌ها شناسایی می‌شود.(1) هرچند که برخی از پزشکان با اصول دخالت عوامل ژنتیکی در بروز بیماری‌های پیچیده احساس راحتی نمی‌کنند، اما این حقیقتی است که اکثر بیماری‌های انسان (به‌عنوان مثال دیابت، بیماری‌های قلبی ‌عروقی، سرطان و اختلالات روانی) در این دسته قرار می‌گیرند. بیماری‌های پیچیده توسط گونه‌های مختلف ژن‌ها در ژن‌های متعدد در ترکیب با عوامل محیطی بروز یافته و به‌طور معمول از هیچ الگوی مندلی ارثی تبعیت نمی‌کنند. این دانش محدود در جامعۀ پزشکی قابل فهم است به این دلیل که عوامل ژنتیکی دخیل در بیماری‌های پیچیده در 15 سال گذشته کشف شده‌اند و اکتشافات جدید همچنان در حال انجام هستند.(2) دو پیشرفت مهم سبب تحول در تحقیقات ژنتیکی در زمینۀ گونه‌های ژنی منجر به بیماری‌های پیچیده شده‌اند و در 7 سال اخیر جنبه‌های دیگری از این مسأله آشکار شده است. نخست تجاری شدن ریزآرایه‌های ژنوتیپی با خروجی بالا است که به ظهور مطالعات گسترده دربارۀ ژنوم منجر شده است (GWAS) و برداشت‌های بی‌نظیری در مورد جایگاه ژن و ارتباط آن با بیماری‌ها به‌دست داده است(2 و 3). از زمان اولین گزارش GWAS در سال 2005، بیش از 2000 جایگاه ژن مرتبط با یک یا چند بیماری پیچیده کشف شده است(4 و 5). با این‌حال بسیاری از گونه‌های ژنتیکی GWAS تنها می‌توانند با یک بیماری مرتبط باشند که احتمالاً مکانیسم زمینه‌ای آن مشخص نیست. در طول 3 سال گذشته، ظهور سیستم ‌های پربازده تعیین توالی نسل جدید (توان بالای سیستم عامل تعیین توالی) امکان دستیابی به آزمایش‌های تعیین توالی اگزوم را فراهم کرده است که به ‌طور خاص زیرمجموعه‌ای از ژنوم‌های انسان را که پروتئین را کدگذاری می‌کنند، کل ژنوم انجامیده است که به ‌طور خاص زیرمجموعه‌ای از ژنوم‌های انسان را که پروتئین را کدگذاری می‌کنند مرتبتعیین توالی می‌کنند، به این ترتیب پیشرفت بزرگی در توضیح اختلالات پیچیده و مندلی حاصل شده است(6 و 7). با کاهش هزینۀ تعیین توالی و تمایل روزافزون بیماران به انجام کار(8)، تعیین توالی کل ژنوم شخص به ابزاری معمول در حرفۀ پزشکی بدل خواهد شد(9 و 10). این چشم‌اندازهای جدید، پزشکان را به چالش می‌کشد تا با حوزۀ به سرعت در حال رشد پزشکی شخصی خود را وفق دهند، روشی نوظهور که با استفاده از مشخصات ژنتیکی فرد برای تصمیم‌گیری در مورد تشخیص، پیشگیری و درمان بیماری ما را هدایت می‌کند(11). با وجود کشفیات اخیر در زمینۀ عمل پزشکی فردی اخیر، منافع بالقوۀ ژنتیک در اعمال بالینی با شک و تردید از سوی اکثریت پزشکان روبرو است(12 و 13). دلایل روشنی از جمله نگرانی‌های اخلاقی در مورد حفظ حریم خصوصی و تبعیض یا پیامدهای منفی از انجام آزمایش‌های ژنتیک برای بیماران (دلهره و اضطراب) در این‌باره وجود دارد(14). دلیلی مهم اما کمتر اذعان شده، این است که ژنتیک یک عرصة علمی مبهم و پیچیده است. این واقعیت که ژنتیک دارای زبانی بسیار فنی با عباراتی مانند GWAS، پلی‌مورفیسم تک نوکلئوتیدی (SNP) و هاپلوتایپ است قطعاً کمکی نمی‌کند. بیدانشی موجب ایجاد ترس میشود و پزشکان فاقد پسزمینه‌های علمی در اپیدمیولوژی ژنتیک ممکن است دچار بیاعتمادی یا کوچک انگاشتن وعدهها و برنامههای کاربردی بالقوۀ اکتشافها و نوآوریهای ژنتیکی در حوزۀ فعالیت خود شوند. با در نظر گرفتن این مسأله، اکنون زمان آن رسیده است که پزشکان بیشتر با مفاهیم اپیدمیولوژی ژنتیک آشنا شوند تا بتوانند به طور فعال در انقلاب پزشکی شخصی مشارکت کنند. هدف ما از نگارش این مقالات و بررسیها کمک به پزشکان غیر متخصص در زمینۀ ژنتیک است تا برای پیشرفتهای ژنتیکی مهمی که در سالهای پیش رو به وقوع خواهند پیوست آماده شوند و از کاربرد پزشکی ژنومی در حوزۀ فعالیت خود به امید دستیابی به پیشگیری بهتر و مراقبت از بیماریهای ژنتیکی انسان استقبال نمایند.
در مقالة 1 از این مجموعه مقالات، جزئیات مفاهیم اولیۀ ژنتیک مولکولی به زبانی که برای کاربر قابل درک باشد بیان می‌‌شود و در دو بررسی بعدی، طرح مطالعه و روش‌های آماری کلاسیک مورد استفاده در اپیدمیولوژی ژنتیک (در مقالة دوم) و وعده‌های واقع‌بینانه و چالش‌های استفاده از اکتشافات و نوآوری‌های ژنتیکی اخیر در علم پزشکی (در مقالة سوم) مورد بحث و بررسی قرار خواهد گرفت.

DNA، RNA و پروتئین‌ها
انسان از دیرباز می‌داند که فرزندان تا حدودی خصوصیات ظاهری، ویژگی‌ها و شخصیت خود را از پدر و مادر به ارث می‌برند. در اوایل دهۀ 1920، یک مادۀ شیمیایی به نام دئوکسی ریبونوکلئیک اسید (DNA) برای حمل اطلاعات ژنتیکی و انتقال این ویژگی‌ها از نسلی به نسل دیگر شناخته شد(15). در 1953، «جیمز واتسون» و «فرانسیس کریک»، مدل مارپیچ دوگانه در ساختار DNA را شرح دادند که کشف اساسی محور اصلی زیست‌شناسی مولکولی است(16). نوکلئوتید، واحد اصلی مولکول پیچیدۀ DNA است که حاوی 3 بخش متشکل از یک قند پنج کربنی، یک مولکول فسفات و یک پایۀ حاوی نیتروژن است که یکی از موارد آدنین (A)، تیمین (T)، سیتوزین (C) و یا گوانین (G) را داراست. نوکلئوتیدها با پیوندهای فسفودی استر به یکدیگر پیوسته‌اند و زنجیره‌ای را تشکیل می‌دهند(شکل a.1). از آنجا که پیوندهای فسفودی استر3 اتم کربن 3’ یک قند را به 5 اتم کربن 5’ قند دیگر می‌پیوندند، 5 انتهای آخر 5’ واجد یک پایانۀ قندی هستند که در آن 5 اتم کربن 5’ آزاد باقی می‌مانند و در انتهای دیگر، پایانۀ قندی دیگر با 3 اتم کربن 3’ آزاد وجود دارد. DNA سلولی به شکل یک مارپیچ دورشته‌ای است. زنجیرۀ مارپیچی طویل پلی‌نوکلئوتیدی به صورت موازی مخالف یکدیگر قرار دارند که در آن ستون‌های قند-فسفات خارج از مارپیچ دوگانه هستند، و پایه‌های نیتروژنی داخل و عمود بر این ستون‌ها قرار دارند. بنابراین یک رشته از سمت 5’5 به 3’3 و رشتۀ دیگر از سمت 3’3 به 5’5 می‌رود. پیوند هیدروژنی بین جفت‌های پایه بر مبنای یک قاعدة خاص و مبنای زوججفت شدن بازی دو رشته را به یکدیگر متصل می‌کنند. : A فقط به T و C فقط به G. هرچند که بیشتر DNAs سلول انسان در هسته قرار دارند، میتوکندری دارای ژنوم مستقل خود است که شباهت زیادی به ژنوم باکتریایی دارد(17). هر سلول در بدن انسان دارای یک مجموعۀ کامل DNA به نام ژنوم است به استثناء گلبول‌های قرمز بالغ خون که فاقد هسته و بیشتر اندامک‌ها هستند. ژن بخشی از DNA در طول ژنوم است که شامل عناصر تنظیمی خاص (5 5’ ناحیۀ ترجمه نشده (UTRs-55’) و 3 3’ ناحیۀ ترجمه نشده (UTRs-33’))، ناحیه‌های کدگذاری نشده (انینترون‌ها) و ناحیه‌های کدگذاری شده (اگزون‌ها) که دستورعمل‌ها را به شکل 3 مجموعه سه جفت بازی به نام کرون‌ها کدون‌ها که اسیدهای آمینه را به پروتئین‌های کاربردی تبدیل می‌کند به ریبوونوکلئیک اسید پیام‌رسان (mRNA) می‌رسانند (شکل 2). در طول رشد و تقسیم سلولی، تکثیر DNA زمانی آغاز می‌شود که دو رشتۀ DNA در یک منشأ خاص باز می‌شود و به عنوان قالب خود مورد استفاده قرار گرفته و نسخۀ دوم هر یک از رشته‌های DNA با کمک DNA پلیمر از DNA و آنزیم‌های دیگر سنتز می‌شود. خود-همانندسازی DNA به شیوه‌ای بسیار دقیق صورت می‌گیرد (کمتر از 1 عدم تطابق در 107 مورد)(18 و 19). هنگامی که خطایی رخ می‌دهد، یک سیستم ترمیم شامل DNA پلیمراز، اگزونوکلئاز، و آنزیم‌های دیگر توالی DNA را بازخوانی و جفت نادرست را ویرایش و از ثبات و صحت DNA در یک فرد و در طول نسل اطمینان حاصل می‌کنند(20 و 21). از سوی دیگر، اگر سیستم ترمیم دچار اشتباه شود و نتواند کار خود را انجام دهد، این عدم تطابق به یک جهش منجر خواهد شد. ترکیب DNA انواع مختلف سلول‌ها در انسان اساساً یکسان است. با این حال، اینکه یک ژن تا چه حد به پروتئین کاربردی تبدیل شود در انواع مختلف سلول‌ها یا حتی در یک نوع از سلول‌ها تا حد زیادی متفاوت است.
به‌ طور کلی DNA یک کتاب دستورعمل است، RNA فتوکپی یک صفحۀ خاص از کتاب است و این صفحه به سلول می‌گوید که چگونه پروتئین را بسازد. مرحله یا گام RNA تضمین می‌کند که انرژی هدر نمی‌رود چرا که تمام کتاب در هر سلول بدن وجود دارد اما سلول‌های خاص تنها نیازمند خوانش بعضی صفحات هستند (به عنوان مثال یک سلول عصبی و یک سلول عضلانی از مجموعة ژن‌های مختلفی متفاوتی استفاده می‌کنند). هنگامی ‌که یک پروتئین خاص مورد نیاز باشد، فرآیندی از رونویسی که مرحلۀ اول بیان ژن است آغاز می‌شود که در آن DNA به یک مولکول حد واسط به‌ نام اسید ریبونوکلئیک (RNA) کپی می‌شود. یکی از رشته‌های DNA به عنوان الگو (که رشتۀ پادرمز نامیده می‌شود) عمل می‌کند و سنتز RNA از سمت 51 5’ به 31 3’ صورت می‌گیرد (مطابق با پایانۀ N به پایانۀ C دنبالۀ پلی‌پپتیدی). رونوشت RNA مکمل الگو است درست مثل تکثیر DNA، به استثناء اینکه بازنوکئوتیدی یوراسیل بازنوکئوتیدی (U) با A جفت می‌شود؛ بنابراین توالی مشابه به رشتۀ غیر الگوی DNA را دارد (که رشتۀ رمز نامیده می‌شود) با این تفاوت که U جایگزین T می‌شود. مکانیسم اصلاح در رونویسی نیز دخیل است، اما دقت آن مشابه آنچه در تکثیر DNA هست، نیست(19). سپس ایننیترون‌های مربوطه (توالی غیر برنامه ‌نویسیکدکننده در متن RNA) در یک مولکول RNA تازه سنتز شده توسط پیرایش RNA حذف شده و RNA پیام‌رسان بالغ تولید می‌شود (mRNA) که تنها حاوی اگزون‌ها است (توالی‌هایی که به ‌طور مستقیم برای اسید آمینه کدگذاری می‌شوندmRNA ). باید به اندامک‌هایی به نام ریبوزوم در سیتوپلاسم که پروتئین‌ها در آن انباشته می‌شوند منتقل گردند. دنبالۀ یک مولکول mRNA، قالب مورد استفاده برای سنتز پروتئین مربوطه است. فرآیندی که برحسب آن mRNA به دنبالۀ خطی اسید آمینه تبدیل می‌شود، ترجمه نام دارد که مرحلۀ دوم بیان ژن است. 3 سه ‌گانه ‌های نوکلئوتید خاص به نام کدون در mRNA آغاز، خاتمه یا اضافه شدن یک اسید آمینه را تعیین می‌کنند و موجب ایجاد یک زنجیرۀ پلی‌پپتیدی می‌شوند. سپس یک RNA حامل (tRNA) که توالی آنتی‌کدون (مکمل کدون در m RNA) و اسید آمینه مربوط را حمل می‌کند، به کدون mRNA متصل شده و اسید آمینۀ جدید را برای گسترش پلی‌پپتید سنتز شده می‌رساند. حداکثر تعداد ترکیب‌های این 3 باز از 4 تا نوع از لحاظ تئوری 64-=43 است (جدول 1). به استثناء یک کدون خاص (AUG) که آغازگر ترجمۀ mRNA به پروتئین و 3 کدون است (UAA، UAG، UGA) که موجب توقف ترجمه می‌شود، 61 جفت از میان 64 جفت، 20 اسید آمینۀ مختلف را رمزگذاری می‌کنند. بیشتر اسیدهای آمینه با بیش از یک کدون ارائه می‌شوند (به عنوان مثال 6 کدون UUA، UUG، CUU، CUA و CUG برای لوسین). یک کدون خاص همیشه یک اسید آمینه آمینة خاص را کدگذاری می‌کند بهجز در مورد ژنوم میتوکُندری که دارای 4 کدون است که به طور متفاوت از DNA هسته‌ای مورد استفاده قرار می‌گیرند. این امر، دو ویژگی مهم کد ژنتیکی را تعیین می‌کند: اختصاصی بودن و وازایایی (که افزونگی نیز نامیده می‌شود). وازایایی (انحطاطافزونگی) باعث می‌شود پروتئین در برخی برابر برخی جهش‌های نقطه‌ای در مناطق برنامه‌نویسی کد کننده مقاوم باشد و موجب جهش کدگذاری مترادف می‌شود. این بدین معناست که جایگزینی‌ها جایگزینی‌ یک نوکلئوتید با نوکلئوتید دیگر الزاما موجب تغییر توالی کدگذاری نمی‌شود (جهش غیر مترادف). انواع توابع فعالیت ‌های بیولوژیکی نیازمند مشارکت پروتئین ‌ها هستند. با این ‌حال نقش ‌های فیزیولوژیک پروتئین به توالی اسید آمینه، پیکربندی و مدولاسیون تعدیل آن از با عوامل مرتبط دیگر مانند پروتئین تنظیم‌کننده، لیگاندها / گیرنده‌ها یا زیرلایه‌ها بستگی دارد. جهش ژن در مناطق خارج از برنامه نویسی نواحی کد کننده، بیان mRNA یا ثبات آن را تحت تأثیر قرار می‌دهد.

کروموزوم‌ها، میتوز و میوز
اغلب سلولهای سوماتیک انسانی دیپلوئید هستند و در هستۀ آنها 46 مولکول DNA مستمر متوالی وجود دارد و هر یک از آنها یک کروموزوم نامیده میشود(22). 46 کروموزموم 2 مجموعه را تشکیل می‌دهند، و در نتیجه 2 نسخه از هر کروموزموم دارای طول مشابه، سانترومتر و ژن ‌های یکسان، و هومولوگ تعیین نامیده شده است. یک هوُمولوگ از سمت مادری و دیگری از سمت پدری به ارث می‌رسد. هر مجموعه دارای 23 کروموزوم تک، 22 اتوزوم و یک کروموزوم X یا Y جنسی. یک مرد دارای یک جفت کروموزوم X و Y و زن یک جفت کروموزوم X است (شکل 3) (22). اتوزوم ها از کروموزوم 22-1 بر حسب طول جفت باز DNA (از طولانی‌ترین به کوتاه‌ترین) سفارش دادهمرتب (چیده می شود / نامیده) می‌شود. کروموزوم X بسیار طویل‌تر از کروموزوم Y است. توالی DNA دو کروموزوم همولوگ معمولاً به‌طور کامل یکسان نیست. DNA در یک کروموزوم در واحدهای پیچیدۀ متعددی به نام نکلئوزوم بسته‌بندی شده است که متشکل از 2 نسخۀ هیستون‌های هسته H2A، H2B، H3، H4 است که اطراف آن با یک قطعه از DNA احاطه شده، مانند بسیاری دانه ‌های تسبیح از مهره‌ها (هیستون‌ها) در یک رشته (DNA). هیستون پنجم H1 در فضای بین هر یک از دو نوکلئوزوم واقع شده است. هیستون H3 و H4 می‌تواند توسط مکانیسم تنظیم پس از ترجمه مانند متیلاسیون، استیلاسیون، اوبیکوییتینهیوبیکوییتینه و، فسفریلاسیون اصلاح شود(23 و 24). این پروتئین‌ها در مکانیسم‌های اپی‌ژنیک نقش دارند که در تعیین الگوی بیان ژن پایدار از سلول به سلول و یا از نسلی به نسل دیگر در غیاب تغییر توالی DNA مؤثراند(25 و 26). همراه هر کروموزوم، یک نقطة فشرده به نام سانترومر، کروموزوم‌ها را به 2 بازو تقسیم می‌کند: بازوی کوتاه‌تر یا "ParmP arm" و بازوی بلند یا "qarmQ arm". علاوه بر شناسایی بیماری‌های ژنتیکی بر اساس الگوهای G- نواربندیی G (رنگ‌آمیزی با محلول گیمسا در متافاز) (27)، بازوهای کروموزوم برای توصیف محل جهش یک ژن خاص مفید است.
دو نوع تقسیم سلولی وجود دارد: میتوز و میوز. میتوز در زمینۀ رشد بدن، تمایز سلولی، خود-بازسازی و احیاء سلول‌های سوماتیک رخ می‌دهد. قسمت‌بندی و همانندسازی DNA همراه میتوز انجام می‌شود و انبار کروموزوم دیپلوئید (2×23 کروموزوم) در سلول‌های دختر حفظ می‌شود. میوز یا کاستمان نوعی تقسیم سلولی تقلیلی است که به‌طور انحصاری در سلول‌های جنسی رخ می‌دهد و باعث ایجاد سلول‌های اسپرم و تخمک می‌شود. در یک اووسیت یا اسپرماتوسیت دیپلوئید، نسخه‌برداری تکثیر DNA دو کروماتید خواهری یکسان تولید می‌کند که پس از آن دو سری تفکیک ِ DNA صورت می گیرد و تقسیمات سلولی صورت می ‌گیرد که به‌ نام میوز 1 و 2 شناخته می‌شوند. در طول میوز 1، کروموزوم‌های هومولوگ که با یکدیگر جفت شده‌اند تا یک کروموزوم دو ظرفیتی به وجود آورند، احتمالاً بخشی از DNA را بین رشتۀ پدر و مادر ردوبدل می‌کنند. این فرآیند تبادل مواد ژنتیکی، نوترکیبی یا کراس‌اوور نامیده می‌شود ]که برگردان فارسی آن "چلیپایگی"‌ است[ و یکی از مکانیسم‌های کلیدی است که به واسطۀ آن تنوع ژنتیکی بین سلول‌های دختر به وجود می‌آید. پس از آن، یک مجموعۀ کامل از کروموزوم‌های 23×2 به سمت یکی از دو قطب کشیده و جدا می‌شوند تا دو سلول هاپلوئید به‌وجود آورد، هر کدام با یکی از همولوگ‌ها. اینکه کدام همولوگ‌ به کدام سلول دختر برود مستقل است و به همین ترتیب علت طبقه‌بندی مستقل نامیده می‌شود. طبقه‌بندی مستقل، دومین مکانیسم اصلی تنوع ژنتیکی است. بنابراین در انسان، تعداد کل ترکیبات ممکن کروموزوم‌ها در یک تخمک 223 است. تقسیم میوز 2، مشابه میتوز است با این تفاوت که سلول‌های دختر نهایی به جای 46 کروموزوم، 23 کروموزوم دارند. در نتیجه میوز نهایتاً تولید چهار تخمک هاپلوئید می‌کند. هر تخمک دارای ترکیب کروموزومی 2323X ، کروموزوم X است که نشانگر 22 اتوزوم و یک کروموزوم Xتکی است، و 50% از اسپرم‌ها دارای 23X 23 ، کروموزوم X و نیم دیگر دارای 23Y 23 Y ، هستند (شکل 4). هنگامی‌که یک اسپرم به یک تخمک متصل می‌شود، یک زیگوت (نطفه) تشکیل شده و وضعیت کروموزومی دیپلوئید دوباره بازسازی می‌شود. در کل، سلول‌های دختر ایجاد شده از تقسیم میتوز، از لحاظ ژنتیکی یکسان‌اند در حالی‌که سلول‌های دختر تقسیم میوزی به دلیل طبقه‌بندی مستقل و نوترکیبی از لحاظ ژنتیکی با یکدیگر متفاوت‌اند. همان‌طور که پیشتر ذکر شد، یک جهش نو ممکن است توسط یک خطا در سیستم ترمیم هنگام تکثیر DNA ایجاد شود. علاوه بر این، خطا در فرآیند نوترکیبی نیز ممکن است به ‌ اختلال ساختار DNA بینجامد. متوسط تعداد کراس‌اوور یا نوترکیبی در هر سلول حدود 55٪ در مردان و حدود 50% بیشتر در زنان است، به این معنی که نوترکیبی، پدیدۀ نادری نیست. نوترکیبی در حفظ تنوع ژنتیکی که از پدر و مادر به فرزندان منتقل می‌شود ضروری است. دیگر استثناء در مورد DNA میتوکندری است که به عنوان یک مولکول منفرد مرتبط تک که از مادر به ارث می‌رسد و نوترکیبی در آن صورت نمی‌گیرد. درست مانند همانندسازیDNA، خطا در نوترکیبی به ندرت رخ می‌دهد و موجب بروز جابه‌جایی، وارونگی، تکرار (دوپلیکاسیون) و یا حذف می‌شود.
اختلال در ساختار کروموزوم‌ها در موارد کمی به اختلالات روانی می‌انجامد. جایگیری جابجایی متعادل متوازن، تبادل بخش‌های کروموزوم بین دو کروموزوم غیر هومولوگ است. جایگیری جابجایی متعادل بین کروموزوم 1 و 11، ژن DISC1 را دچار اختلال کرده و با افزایش خطر ابتلا به اسکیزوفرنی همراه است(29 و 30). وارونگی کروموزوم هنگامی رخ می‌دهد که دو سُکند (شکستگی) در یک کروموزوم وجود داشته باشد و همان بخش دوباره با جهت‌گیری معکوس تشکیل می‌شوقرار می ‌گیرد. وارونگی پریسنتریک روی کروموزوم 9 با شیزواسکیزوفرنی همراه است(31).

ویژگی‌های ژنوم انسان
تکمیل پروژه‌های تحقیقاتی انجام شده بر روی ژنوم انسان از جمله پروژة ژنوم انسان در 2003 و پروژة 1000 ژنوم در 2012 چندین ویژگی مهم ژنوم انسان را مشخص کردند (32 و 33): 1) حدود 3 میلیون جفت باز در ژنوم انسان وجود دارد؛ 2) 99% از بازهای نوکلئوتیدی در تمام انسان‌ها یکسان‌اند 3) حدود 30000 هزار ژن در انسان وجود دارد و میانگین طول آنها حدوداً 3000 جفت باز است؛ 4) ژن‌ها بیانگر کمتر از 2% از ژنوم انسان هستند؛ 5) بیش از 50% از DNA ژنومی دارای توالی DNA غیرتکراری هستند و بیشتر ژن‌ها توالی DNA منحصر به فردی دارند؛ 6) حدود 45% از DNA ژنومی دارای توالی تکراری هستند که تصور می‌شود در حفظ ساختار کروموزوم نقش داشته باشند؛ 7) 38 میلیون SNP تأیید شده وجود دارد که در آنها یک نوکلئوتید واحد در جایگاه خاصی در میان 1092 ژنوم انسان به ‌صورت متفاوت قرار گرفته است.

گونه‌های تنوعات ژنتیکی
کل پایگاه داده‌های فعلی در مورد تنوع ژنومی انسان به تازگی از یک پانل اطلاعات توالی کل ژنوم در 1092 نفر از 14 جمعیت در پروژۀ 1000 ژنوم به‌ دست آمده است(33). هدف بعدی این پروژه، تعیین توالی ژنوم 2500 نفر از 27 جمعیت انسانی مختلف در سراسر جهان است(34). اگرچه 99% از توالی‌های ژنومی DNA یکسان هستند، آن 1% باقی مانده دلالت براست که 38 میلیون تنوع ژنتیکی بین افراد غیر مرتبط ایجاد می‌کندارد که نشان می‌دهنده وجود یک نوع آلل در هر 80 جفت باز به ‌طور متوسط وجود دارداست. در حین گردجمع ‌آوری توافق دربارۀ توالی‌های مشترک، تفاوت بین توالی ‌های نوکلئوتیدی افراد مختلف در مد نظر قرار گرفت. SNP بیانگر 90% از تنوع‌های انسانی هستند(35). اگر تناوب شیوع یک SNP بیش از 5% باشد، یک نوع (واریته) مشترک شایع یا پلی‌مورفیسم لحاظ می‌شود. اگر تناوب شیوع بین 5-1٪ باشد، یک تناوب کم SNP کم شیوع در نظر گرفته می‌شود. اگر تناوب شیوع کمتر از 1% در جمعیت باشد، به عنوان جهش شناخته می‌شود. علاوه بر SNPها، دیگر تنوع‌های ژنی نیز در ژنوم انسان مشاهده شده‌اند از جمله میکروستلایت‌ها، مینی‌ستلایت‌ها و تنوع در تعداد کپی (CNV). این پروژه 4/1 میلیون بخش تغییرات الحاقی و حذفی کوتاه دو آللی و بیش از 14000 حذف عمده نیز یافته است(33). از آنجا که این تنوع‌های ژنتیکی حین مونتاژ توالی کشف شده‌اند، محل آنها شناخته شده است و یک منبع کلیدی از نقشة ژن‌ها را که مستعد بیماری‌های شایع هستند ارائه می‌دهند. تنوع ژنی ممکن است در هر منطقه‌ای از ژنوم رخ دهد. یک SNP که در منطقۀ برنامه‌نویسی کدکننده (کدگذاری) بدون تغییر در اسید آمینۀ مربوطه قرار گرفته است، مترادف نامیده می‌شود در حالی‌که SNPs برنامه‌نویسی کدکننده که موجب ایجاد تغییر در اسید آمینه، تغییر قالب خواندن یا یک کد توقف پیشین می‌شوند، به ترتیب نامرتب نامترادف، تغییر قالب یا بی‌معنی به ترتیب خوانده می‌شوند. SNPs موجود در یک منطقۀ برنامه‌نویسی کدکننده غیر پروتئینی در یک ژن ممکن است با تغییر عناصر نظارتی به عنوان مثال عامل رونویسی، محل‌های اتصال و یا پیکربندی، بیان پروتئین را تحت تأثیر قرار دهند. در انسان معمولاً تنها دو آلل در محل SNP وجود دارد، اما گاهی اوقات 3 آلل نیز گزارش می‌شود، مانند e2 و e3 و e4 در لکوس ژن. (36) APOE رایج‌ترین نامگذاری SNP با استفاده از یک مرجع منحصر به فرد عدد SNP انجام می‌شود (rs). یک مثال rs 10994336 SNP در ژن ANK3 است که با اختلال دوقطبی مرتبط است(37). اطلاعات SNP از منابع قابل دسترس برای عموم در اختیار همه قرار دارند و دائماً به‌روز می‌شوند، مانند منبع پلی‌مورفیسم dbSNP، پایگاه داده ژنوم تنوع انسانی ، پروژۀ بین‌المللی HapMap، کنسرسیوم SNP یا پایگاه داده‌های پروژۀ 1000 ژنوم.
میکروستلایت‌ها یا تکرارهای کوتاه پشت سر هم (STR) به توالی کمتر از 10 bp (جفت باز) از DNA اطلاق می‌شود. واحدهای تکراری 100-10 نوکلئوتید مینی ‌ستلایت یا متغیر تکرار پشت سر هم متغیر (VNTR) نامیده می‌شود(22). تعداد آلل‌ها در میکروستلایت‌ها و مینی‌ستلایت‌ها، معمولاً 5 تا یا بیشتر است. هرچند که هم میکروستلایت‌ها و هم مینی‌ستلایت‌ها بسیار ناپایداراند، اکثر تغییرات هیچ عواقب بالینی مضری ندارند. مکانیسم‌های جهش در میکروستلایت‌ها و مینی ‌ستلایت‌ها متفاوت است. در مینی‌ستلایت‌ها، جهش در طول نوترکیبی همولوگ در میوز رخ می‌دهد، اما میزان آن حدود 10 برابر بیشتر از چیزی ا‌ست که در توالی DNA روی می‌دهد. میکروستلایت‌ها حین تکثیر و همانندسازی دچار خطای جفت شدن اشتباه می‌شوند و سپس ژن‌ها در سیستم ترمیم غیرفعال شده و همین مسأله موجب گسترش تکرار می‌شود(22). این میزان جهش بسیار بیشتر از فرآیندهای جهشی ا‌ست که منجر به SNPs می‌شود. برخی از آنها موجب افزایش خطر ابتلا به بیماری‌ها می‌شوند. به عنوان مثال، در حالی‌که افراد سالم کمتر از 36 تکرار CAG در ژن HD دارند، تعداد تکرارها در افراد مبتلا به بیماری هانتیگتون به بیش از 40 افزایش می‌یابد(1). نوع دیگری از پلی‌مورفیسم، تنوع تعداد کپی نامیده می‌شود. CNV نسخه‌برداری یا کاهش یک بخش DNA است به تا Mb 5/1) (bp2000 ممکن است تنها 2 یا چند آلل داشته باشند CNVs (حذف یا نسخه‌برداری) می‌توانند عواقب مهم عملکردی داشته باشند و با اختلالات روانی مانند اسکیزوفرنی مرتبط باشند(38)

آلل‌ها و ژنوتیپ‌ها
محل قرار گرفتن توالی DNA یا ژن روی یک کروموزوم است که یک لکوس نامیده می‌شود. اگر بیش از یک نوع نوکلئوتید در یک لکوس خاص در یک جمعیت باشد، هر نوکلئوتید یک آلل نامیده می‌شود. اکثر مناطق پلی‌مورفیک فقط دو آلل دارند، و برخی از آنها دارای بیش از دو آلل هستند. در صورت وجود دو آلل مشابه از کروموزوم‌های همولوگ در یک لکوس خاص در فرد، او "هموزیگوت" نامیده می‌شود. در صورتی که دو آلل متفاوت باشند، فرد "هتروزیگوت" خوانده می‌شود. درSNPs دو آللی، آللی که دارای تناوب بیشتر در یک جمعیت است، آلل مهم/اصلی و دیگری آلل جزئی/فرعی نامیده می‌شود. 3 یا چند ترکیب مهم آلل‌ها در یک لکوس خاص (به عنوان مثال آلل اصلی/آلل اصلی، آلل اصلی/آلل فرعی، آلل فرعی/آلل فرعی) ژنوتیپ نامیده می‌شوند. گاهی اوقات، ژنوتیپ به معنای اساسنامۀ ترکیب کلی ژنتیکی فرد به کار می‌رود.
به عنوان مثال SNP rs1024582 در ژن CACNA1C با اختلال دوقطبی و شیزواسکیزوفرنی همراه است(39). دو آلل A و G در اینجا وجود دارند، که A با تناوب شیوع 7/33% آلل فرعی و G آلل اصلی است. 3 ژنوتیپ یک فرد در این لکوس AA، AG و GG هستند. آلل فرعی A موجب افزایش خطر ابتلا به اختلال دوقطبی و اسکیزوفرنی می‌شود(39).

هالوتیپ‌ها و عدم تعادل پیوستگی (LD)
آلل‌های لکوس‌های مختلف گاهی اوقات به ‌طور مستقل از یک نسل به نسل دیگر منتقل نمی‌شوند. آنها می‌توانند به صورت فیزیکی به روی کروموزوم بچسبند به هم متصل باشند و کراس‌اوور در طول نسل‌ها آنها را از هم جدا نمی‌کند. این مجموعه آلل‌ها هاپلوتیپ نامیده می‌شود (شکل 5). مؤسسۀ ملی بهداشت ایالات متحد، پروژۀ بین‌المللیMap Hap را در سال 2002 به منظور توسعۀ یک نقشۀ هالوتیپ در انسان آغاز کرد(40). در فاز اول پروژه، بیش از 1 میلیون SNP معمول در 270 نفر از چهار جمعیت متفاوت از لحاظ جغرافیایی، شامل ژاپنی، چینی‌های هان، یوروبا از نیجریه و آمریکایی از تبار شمال غربی اروپا در سال 2005 تعیین ژنوتیپ شدند(41). این داده‌ها برای کشف الگوی ارتباط میان SNPها در ژنوم انسان استفاده شدند، و چگونگی متفاوت بودن الگوها در جمعیت‌های مختلف مورد بررسی قرار گرفت. در فاز دوم Hap Map، بیش از 1/3 میلیون SNP برای ایجاد نسل دوم نقشه هاپلوتیپ انسان ژنوتیپ شدند(42).
عدم تعادل پیوستگی یا به بیان دیگر عدم تعادل لینکاژ (LD) ارتباط غیر تصادفی آلل‌ها در دو یا چند جایگاه ژنی را که می‌توانند روی یک کروموزوم باشند یا نباشند اندازه‌گیری می‌کند. به عنوان مثال، ما ممکن است دو جایگاه با آلل‌های A1/A2 و B1/B2 داشته باشیم. B1 و A1 روی یک کروموزوم و آلل‌های A2 و B2 روی یک کروموزوم همولوگ دیگر. فراوانی A1، در یک جمعیت، 60% و B1، 30٪ است. اگر نوترکیبی این دو جایگاه مستقل باشد، فراوانی مورد انتظار از چهار هالوتیپ ممکن A1B1، A1B2، A2B1 و A2B2، 18٪، 42٪، 12٪ و 21% خواهد بود. اگر توزیع این 4 هاپلوتیپ با فراوانی تئوریک سازگار و تطابق داشته باشد، آلل‌ها در تعادل ارتباط پیوستگی هستند. اگر این توزیع به‌طور قابل توجهی با فراوانی تئوریک متفاوت باشد، آلل‌ها در عدم تعادل پیوستگی هستند که نشان می‌دهد این دو جایگاه مستقل نیستند. اگر یکی از آلل‌ها، آلل باعث بیماری باشد، هاپلوتیپ شامل این آلل، هاپلوتیپ حاوی بیماری در نظر گرفته می‌شود. در اغلب شرایط، یک نوع ژنتیکی که مرتبط با بیماری تشخیص داده می‌شود، آلل تابعی موجب بیماری نیست، بلکه پروکسی (نشانگر) SNP است. این نشان می‌دهد که پروکسی SNP در همان بلوک LD است با SNP سببی بالقوه که در آن مجموعه (آرایه) ژنوتیپ نمی‌شود. LD می‌تواند در طول زمان تغییر کند و الگوهای LD می‌توانند بسته به جمعیت متفاوت باشند. اندازۀ بلوک‌های LD که فراوانی نوترکیبی را نشان می‌دهد، در جمعیت آفریقایی کوچک‌تر از جمعیت آسیایی و اروپایی ا‌ست (شکل 6)(43). بنابراین شناخت الگوی LD در یک گروه خاص قومی (به عنوان مثال مشابه پروژۀ Hap Map) برای درک بهتر علائم مفید است و سرانجام به کشف علت دخیل در بیماری منجر خواهد شد(44 و 45). بسیاری عوامل دیگر از جمله انحراف تصادفی ژنتیکی، رشد جمعیت، اختلاط، هم‌خونی، انتخاب طبیعی، و جهش نو می‌توانند بر الگوی LD تأثیر بگذارند(46). با استفاده از مثال هاپلوتیپ که در بالا ذکر شد، یک آزمون آماری برای اندازه‌گیری LD، Dmax/ (PA1B1-(PA1PB1 =Dmax/D=D1 است که در آن P نشان‌دهندۀ احتمال هاپلوتیپ خاص و Dmax حداکثر تفاوت بین PA1B1 و PA1PB1 است. D1 محدودۀ 1- تا 1 است. 1 یا 1- نشان ‌دهندۀ این است که هیچ نوترکیبی بین دو جایگاه A و Bوجود ندارد و O نشان می‌دهد که A و B در تعادل ارتباط پیوستگی هستند. اگر فراوانی آلل A1 و B1 یکسان باشد، مقدار بالای D1 D’ نشان می‌دهد که A جانشین خوبی برای B است. با این حال اگر اندازۀ نمونه کوچک باشد یا یک آلل نادر باشد، D1 D’ بالا می‌رود. روش دیگر اندازه‌گیری LD با استفاده از ضریب مجذور r2 (که در محدودۀ 0 تا 1 است) صورت می‌گیرد. r2، حجم نمونه و فراوانی آلل را در بر می‌گیرد. بنابراین،D1 D’ به‌طور گسترده‌ای توسط متخصصین متخصصان ژنتیک برای ارزیابی الگوهای نوترکیبی مانند تعریف الگوهای هاپلوتیپ استفاده می‌شود، در حالی ‌که r2 معیار اندازه‌گیری مناسب‌تری برای عدم تعادل پیوستگی در مطالعات مرتبط همبستگی است(47). به عنوان مثال، 2 SNP، مقدار D1 D’ 85/0 و r2 18/0 را نشان می‌دهند. در یک مطالعۀ ارتباطی این دو SNP را به دلیل r2 کم، نمی‌توان جایگزین یکدیگر کرد. اندازه‌گیری LD برایSNPs مجاور به صورت جفت برای گروه‌بندی بیش از دو جایگاه ژنی در یک هاپلوتیپ، بلوک LD نامیده می‌شود، در صورتی که میزان D1 D’ در یک گروه بین هر یک از دو SNP بالاتر از یک آستانۀ خاص باشد (برای مثال به عنوان 8/0).

نتیجه‌گیری
اکنون با داشتن یک پس‌زمینۀ قوی‌تر دربارۀ ژنتیک مولکولی، ما آمادۀ بحث دربارۀ مفاهیم اختصاصی‌تر اپیدمیولوژی ژنتیکی از جمله مطالعة اجرای طرح، راهکارهای شناسایی ژن، انتخاب نشانگرهای ژنتیکی، فناوری‌های تعیین ژنوتیپ و تعیین توالی، تجزیه و تحلیل داده‌ها، تفسیر داده‌ها و کاربردهای بالقوۀ آنها در پزشکی شخصی هستیم. دو مقالۀ بعدی در این مجموعه به بررسی این مسائل خواهند پرداخت.

واژه‌نامه
بیماری‌های مندلی:
فنوتیپ‌هایی که با جهش یک ژن منفرد به ‌وجود می‌آیند و نمایی از الگوی مشخص ارثی می‌دهند.

بیماری‌های پیچیده: فنوتیپ‌هایی که توسط تنوع تعداد ژن ‌هایی متعدد، عوامل خطر زیست‌محیطی، و تداخل آنها به ‌وجود می‌آیند. آنها الگوهای کلاسیک توارث مندلی را نشان نمی‌دهند.
مطالعات گستردۀ ارتباط همبستگی ژنومی: بررسی ارتباط همزمان بین زیرمجموعۀ متراکمی از واریته‌ انواع ژنتیکی از لحاظ تئوری که تنوعات ژنتیکی کل ژنوم و فنوتیپ مورد نظر را تحت پوشش قرار می‌دهد.

پلی‌مورفیسم تک نوکلئوتیدی: (SNP) یک نوع تغییر DNA که در آن یک جفت باز در موقعیت خاص تغییر می‌کند.
ژن: بخشی از DNA که در عناصر خاص نظارتی، مناطق غیر برنامه‌نویسی کد کننده و مناطق برنامه‌نویسی کدکننده تعبیه شده که دستورعمل تجمع ترتیب اسیدهای آمینه را در یک پروتئین می‌دهند.

ژنوتیپ: قانون ژنتیکی در یک جایگاه خاص یا گاهی اوقات قانون کلی ژنتیک یک فرد.
آلل: هر نوع نوکلئوتید در یک جایگاه ژن در یک بخش DNA در صورت وجود دو یا چند نوع نوکلئوتید مختلف.

جایگاه ژن: محل منحصر به فرد در یک کروموزوم است که در آن یک SNP یا یک ژن قرار گرفته است.

هموزیگوت: افرادی که در آنها دو آلل یکسان در کروموزوم‌های همولوگ در یک جایگاه ژنی خاص یکسان هستند.

هتروزیگوت: افرادی که در آنها دو آلل متفاوت در کروموزوم‌های همولوگ در یک جایگاه ژنی خاص متفاوت هستند.

عدم تعادل پیوستگی: اندازه‌گیری ارتباط غیرتصادفی بین آلل‌ها در جایگاه‌های مختلف./

مطالب پیشنهادی ما برای مطالعه

الکلیسم تحت تأثیر صدها ژن است

تحقیق تازه‌ای که در PLOS ژنتیک منتشر شده است پس از آشکار کردن صدها ژن که ممکن است اشتیاق به مصرف الکل را افزایش دهند، شواهدی دال بر تأثیر ژنتیک بر اعتیاد به الکل فراهم می‌آورد. اختلال مصرف الکل با داش

پیش‌بینی ریسک آلزایمر در 18 سالگی با محاسبات ژنتیک

محققان یک سیستم امتیازدهی ژنتیک را توسعه داده‌اند که می‌گویند می‌تواند ده‌ها سال پیش از بروز نشانگان آلزایمر بگوید کدام گروه از افراد بزرگسال در ریسک توسعة این بیماری قرار دارند.