• درسالهای اخیر در صنعت اطلاعات شاهد توجه زیادی به داده کاوی بوده ایم که می توان دلیل این توجه روز افزون را دسترسی به حجم بسیار زیادی از داده ها و نیاز به کشف و استخراج اطلاعات و دانش مفید از آنها دانست، و می توان از این اطلاعات و دانش کسب شده در قسمت های مختلفی همچون مدیریت کسب و کار ،کنترل تولید، تحلیل بازار و اکتشافاتی در زمینه دانش و مهندسی استف
    • مقدمه
      درسالهای اخیر در صنعت اطلاعات شاهد توجه زیادی به داده کاوی بوده ایم که می توان دلیل این توجه روز افزون را دسترسی به حجم بسیار زیادی از داده ها و نیاز به کشف و استخراج اطلاعات و دانش مفید از آنها دانست، و می توان از این اطلاعات و دانش کسب شده در قسمت های مختلفی همچون مدیریت کسب و کار ،کنترل تولید، تحلیل بازار و اکتشافاتی در زمینه دانش و مهندسی استفاده نمود.
      با توجه با اهمیت این مبحث و کاربردهای آن ، در این فصل سعی بر آن شده تا خلاصه ای از کاربردهای داده کاوی در برخی از صنایع بزرگ مورد بررسی قرار گیرد و از آنجا که تکنیک های بصری سازی داده ها در کاربردهای داده کاوی کاملا مشهود است و در مباحث پیشین در این زمینه بحثی صورت نگرفته ، لذا در ائامه سعی بر آن شده تا با نگاهی گذرا به این مبحث آشنایی بیشتری با آن پیدا کنیم. و در پایان نیز اشاره ای به روندهای داده کاوی خواهیم کرد.
      داده کاوی در زمینه علوم زیست شناسی و تحلیل داده های DNA
      در دهه های گذشته شاهد رشد سریع در تحقیقات زیست شناسی بوده ایم، از توسعه داروهای جدید و درمانهای پیشرفته سرطان گرفته تا شناخت و بررسی human genome بوسیله کشف الگوهای متوالی در مقیاس های بزرگ و عملکردهای ژنی.
      علم تعامل زیادی با تحقیقات زیست شناسی که بر تحلیل داده هایDNA متمرکز است ،دارد.تحقیقات اخیر در زمینه تحلیل DNA ما را به سمت کشف علل ژنتیک بسیاری از امراض و ناتوانایی ها و همچنین کشف داروها و رویکردهای جدید برای تشخیص بیماریها وجلوگیری و درمان آنها هدایت می کند.تمرکز اصلی تحقیقات genome بر مطالعه توالی های DNA است.تمام توالی های DNA در بر دارنده چهار چوبی هستند که نوکلئوتیدهانامیده می شوند ، که عبارتند از:
      enine(A) cytosine(C) guanine(G) thymine(T) .
      هر انسان حدود ۱۰۰۰۰۰ ژن دارد و هر ژن شامل ۱۰۰ نوکلئوتید است که با ترتیب خاصی قرار گرفته اند.تقریبا تعداد نامحدودی راههای مختلف برای ترتیب قرار گرفتن و توالی نوکلئوتیدها برای تشکیل ژنها وجود داردو این چالشی است برای شناسایی توالی قرارگرفتن ژن های خاص که نقش اصلی در بیماریهای مختلف را بازی میکنند.از زمانی که تحلیل الگوهای sequential و تکنیک های مشابه در داده کاوی توسعه و گسترش یافت ، داده کاوی تبدیل به ابزار قدرتمندی شد که سهم قابل توجهی در تحلیل های DNA دارد.
      • یکپارچگی معنایی غیریکنواختی و پایگاه داده های توزیع شده genome:
      به علت توزیع گسترده و تولید کنترل نشده و استفاده از داده های بسیار متنوعDNA ، یکپارچگی معنایی این قبیل ناهماهنگی ها و پایگاه دادههای گسترده و تحلیل های هماهنگ و صحیح داده های DNA وظیفه بسیار مهمی است و همین مسئله سبب توسعه انباره داده های یکپارچه داده های DNA و ادغام کردن داده های توزیع شده به منظور ذخیره و مدیریت داده های ژنیتیک شده است. روش های Data cleaning و Data integration که در داده کاوی توسعه یافته اند به یکپارچگی داده های ژنتیک و ساخت انباره داده ها برای تحلیل داده ها کمک خواهد کرد.

      مقدمه
      با توجه با اهمیت این مبحث و کاربردهای آن، در این فصل سعی بر آن شده تا خلاصه ای از کاربردهای داده کاوی در برخی از صنایع بزرگ مورد بررسی قرار گیرد و از آنجا که تکنیک های بصری سازی داده ها در کاربردهای داده کاوی کاملا مشهود است و در مباحث پیشین در این زمینه بحثی صورت نگرفته، لذا در ائامه سعی بر آن شده تا با نگاهی گذرا به این مبحث آشنایی بیشتری با آن پیدا کنیم. و در پایان نیز اشاره ای به روندهای داده کاوی خواهیم کرد.داده کاوی در زمینه علوم زیست شناسی و تحلیل داده های DNA
      در دهه های گذشته شاهد رشد سریع در تحقیقات زیست شناسی بوده ایم، از توسعه داروهای جدید و درمانهای پیشرفته سرطان گرفته تا شناخت و بررسی human genome بوسیله کشف الگوهای متوالی در مقیاس های بزرگ و عملکردهای ژنی.علم تعامل زیادی با تحقیقات زیست شناسی که بر تحلیل داده هایDNA متمرکز است، دارد. تحقیقات اخیر در زمینه تحلیل DNA ما را به سمت کشف علل ژنتیک بسیاری از امراض و ناتوانایی ها و همچنین کشف داروها و رویکردهای جدید برای تشخیص بیماریها وجلوگیری و درمان آنها هدایت می کند.تمرکز اصلی تحقیقات genome بر مطالعه توالی های DNA است. تمام توالی های DNA در بر دارنده چهار چوبی هستندکهنوکلئوتیدهانامیده می شوند، که عبارتند از:enine(A) cytosine(C) guanine(G) thymine(T). هر انسان حدود ۱۰۰۰۰۰ ژن دارد و هر ژن شامل ۱۰۰ نوکلئوتید است که با ترتیب خاصی قرار گرفته اند.تقریبا تعداد نامحدودی راههای مختلف برای ترتیب قرار گرفتن و توالی نوکلئوتیدها برای تشکیل ژنها وجود داردو این چالشی است برای شناسایی توالی قرارگرفتن ژن های خاص که نقش اصلی در بیماریهای مختلف را بازی میکنند. از زمانی که تحلیل الگوهای sequential و تکنیک های مشابه در داده کاوی توسعه وگسترش یافت، داده کاوی تبدیل به ابزار قدرتمندی شد که سهم قابل توجهی در تحلیل های DNA دارد.
      • یکپارچگی معنایی غیریکنواختی و پایگاه داده های توزیع شده genome:به علت توزیع گسترده و تولید کنترل نشده و استفاده از داده های بسیار متنوعDNA، یکپارچگی معنایی این قبیل ناهماهنگی ها و پایگاه دادههای گسترده و تحلیل های هماهنگ و صحیح داده های DNA وظیفه بسیار مهمی است و همین مسئله سبب توسعه انباره داده های یکپارچه داده های DNA و ادغام کردن داده های توزیع شده به منظور ذخیره و مدیریت داده های ژنیتیک شده است. روش های Data cleaning و Data integration که در داده کاوی توسعه یافته اند به یکپارچگی داده های ژنتیک و ساخت انباره داده ها برای تحلیل داده ها کمک خواهد کرد.

    • سایز : ۵۲۷ کیلو بایت
    • فرمت : doc
    • تعداد صفحات : ۳۰
  • برای مشاهده تصویر این فایل اینجا کلیک کنید.

FileHub ID : SID6327

برای ثبت امتیاز کلیک کنید
[کلی: 0 میانگین: 0]
لینک کوتاه این مطلب: https://filehub.ir/QGoq9
<<ادامه  پروژه-درس-مباني-و-مهندسي-نرم‌افزار-موسسه-بازرگاني-نوين-گلستان-20-ص

۰ دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

موبایلتو شارژ کن