چکیده پردازش دادههای حجمزیاد وابسته به برنامهنویسی موازی است. تاکنون نگاشت
کاهش که یکی از روشهای تکراری دادهکاوی در الگوریتم خوشهبندی بدون نظارت است در الگوریتم K-means استفاده شدهاست. اما بهبود مقیاسپذیری و کارایی این الگوریتم همواره یکی از اهداف
برای دادهکاوی در دادههای حجمزیاد است. در اینجا یک الگوریتم بسطیافته از مدل K-means پیشنهاد شدهاست که موجب افزایش کارایی عامل مقیاسپذیری در زمان افزایش حجم دادهها میشود. بطوری که در الگوریتم پیشنهادی، وابستگی مستقیم هر رکورد ساختار با رکورهای وضعیت موجود اعمال میشود. با ایجاد این وابستگی، هزینههای نگاشت کاهش و عملیات آغاز نگاشت تاحد زیادی کاهش مییابد. با توجه به بهبود صورتیافته در الگوریتم K-means و استفاده از روش نگاشت کاهش تکراری، میزان کارایی و مقیاسپذیری تاحد مطلوبی افزایش مییابد و آزمایشات ما این بهبودی نتایج را تایید میکنند. واژگان كليدي: دادهکاوی، دادههای حجمزیاد، نگاشت کاهش تکراری، برنامهنویسی موازی، بسط الگوریتم K-means، پردازش توزیعی.خوشهبندی در بسیاری از حوزههای علوم کامپیوتر و رشتههای مربوطه همچون دادهکاوی، شناخت الگو و یادگیری ماشین به کار رفته است. الگوریتم K-means بیتردید مشهورترین الگوریتم خوشهبندی است و دلیل آن، سادگی، کارایی و تلاشهای پژوهشی انجام شده برای آن است. ویژگی شیب نزولی در K-means اغلب موجب میشود تا آن به بهینهی محلی همگرا شود و تضمینی برای دقت ندارد. علاوه بر این، راهحل نهایی آن اغلب دور از بهینهی سراسری است. دلیل اصلی این است که K-means حساسیت بالایی برای انتخاب مراکز اولیه دارد. بنابراین در بسیاری از مطالعات جدید، به بهبود روش مقداردهی اولیه توجه شده است. بخشی از شهدای جنت شهر...
ادامه مطلبما را در سایت شهدای جنت شهر دنبال می کنید
برچسب : نویسنده : basijanato بازدید : 11 تاريخ : سه شنبه 16 آبان 1402 ساعت: 18:42