دوستانی که قصد پیاده سازی الگوریتم های R با C# را دارند لطفا به جز الگوریتم های زیر و الگوریتم هایی که در کامنت توسط دوستان دیگر نوشته شده است می توانند پیاده سازی خود را شروع کنند

apriori

SVM

NNet

kmean

در صورتی که الگوریتمی را انتخاب می کنید ان را در کامنت اضافه کنید تا مشخص شود و دوستان دیگر ان را پیاده نکنند.

برای انتخاب الگوریتم از لینک زیر استفاده کنید

http://cran.r-project.org/web/views/MachineLearning.html


برچسب‌ها: داده کاوی
+ نوشته شده در یکشنبه پانزدهم دی 1392ساعت 10:50 توسط مهدی نصیری |

سايتی تخصصی در زمینه داده کاوی  چند ماهي است راه افتاده است و مطالب وبلاگ به ان انتقال يافته است. دوستاني كه مايل به همكاري در اين سايت هستند لطفا به من ميل بزنند.

IranDataMiner.ir



+ نوشته شده در یکشنبه سی و یکم مرداد 1389ساعت 15:39 توسط مهدی نصیری |

در ارشيو دي ماه چند نمونه سوال قرار دارد

1- نوع صفات زير چيست؟ نمره ، شماره رديف

2- اگر اجتماع A,B با C,D برابر F باشد در مورد ضريب تقويت و اطمينان قوانين زير توضيح دهيد

A-->B,C-->D


+ نوشته شده در دوشنبه چهارم مرداد 1389ساعت 7:31 توسط مهدی نصیری |

چند نمونه سوال  داده کاوی در ارشیو دی ماه قرار  دارد

چند نمونه سوال ديگر براي دانشجويان ارشد داده كاوي

1- براي داده كتگوري براي خوشه بندي چگونه اينكار را مي كنيد؟

2- تعداد خوشه مناسب را چگونه بدست مي اوريد

3- اگر داده اي كتگوري غير باينري باشد با اپريوري چگونه كار مي كند

+ نوشته شده در جمعه بیست و هشتم خرداد 1389ساعت 21:46 توسط مهدی نصیری |

در گروه های دو نفره یکی از الگوریتم ها را انتخاب و در نظر وارد کنید. نحوه کار را در یک متن توضیح دهید.

داده اي كه بايد از ان استفاده شود را از لينك زير مي توانيد دانلود كنيد.

دانلود داده

1-

2-time series

3-regression

4-

6-pca/factor

7-

8-svm

9-gri

10-apriori

11-sequence

12-k-means

13-logistic

14-discriminant

15-feature selection

16-

17-carma

18-anomaly

19-bayes net



22-genlink

23-cox

+ نوشته شده در چهارشنبه بیست و ششم خرداد 1389ساعت 21:41 توسط مهدی نصیری |

ابزار کلمنتاین در سالهای اخیر پرکاربردترین ابزار داده کاوی است و می توانید از لنیک زیر نسخه ۱۲ که نسه ما قبل اخر ان است را دانلود کنید.

توجه کنید که بعد از نصب باید ۳ فایل درون فایل crack را در پوشه bin کپی کنید تا اجرا شود.

لینک

+ نوشته شده در دوشنبه بیست و چهارم خرداد 1389ساعت 19:3 توسط مهدی نصیری |

اين ابزار كه از بهترين ابزارهاي داده كاوي است نسخه جديد ان با نام spss ibm modeler 13 به بازار امده است.

مزيتهاي اين نسخه نسبت به نسخه 12 :

1-بهينه كردن تكنيك ها براي مجموعه داده هاي بزرگ

2- افزايش مصورسازي الگورتيم هاي كليدي مانند شبكه هاي عصبي و درخت تصميم

3- محيط مصورسازي جديد براي الگوريتم هاي كليدي و مدل هاي تركيبي در ساخت نتايج براي فهم بهتر

4-بروزرساني الگوريتم هاي شبكه عصبي و خطي

5- توانايي در خواندن و نوشتن داده از xml

6- بهينه كردن پردازش پايگاه داده بزرگ براي الگوريتم هاي كليدي

اگر نسخه كرك شده اي از اين نرم افزار رسيد لطفا ما را هم خبر كنيد.

+ نوشته شده در چهارشنبه نوزدهم خرداد 1389ساعت 12:6 توسط مهدی نصیری |

نمودار زير بيشترين استفاده از نرم افزارهاي داده كاوي را نشان مي دهد. كلمنتاين اول است كه نسخه 13 ان با نام spss modeler امده است. اين امار از بين 368 داده كاو گرفته شده است و استفاده از يك ابزار به تنهايي يا با استفاده از كمك ابزارهاي ديگر امار گيري شده است. در اين راي گيري rapid miner از رتبه 4 در 3 سال گذشته به رتبه دو و weka از رتبه 3 به رتبه پايين تر قابل توجه است. حضور exel در رتبه 4 كمي براي من لااقل تعجب بر انگيز است كه انگيزه ام را براي يك كار سنگين عملي با ان مشتاق كرده است. sql/server هم با وجود شهرتش رتبه خوبي ندارد و نبايد داشته باشد. حرف هميشگي ام را در مورد ان كه مانند دوربين يك موبايل است و كار اصلي موبايل عكس گرفتن نسيت، است.

SPSS PASW Modeler (formerly Clementine) (68 alone, 52 with other tools, 120 total)
RapidMiner (36 alone, 41 w. other tools, 77 total)
SAS (39 alone or with SAS EM; 36 with other tools, 75 total)
Excel (1 alone, 68 total)
SAS Enterprise Miner (39 alone or with SAS; 28 w/ other tools; 67 total)
R (2 alone, 51 total)
Your own code (3 alone, 44 total)
KXEN (25 alone, 31 total)
Weka (now Pentaho) (0 alone, 31 total)
MATLAB (0 alone, 26 total)
Other commercial tools (0 alone, 19 total)
KNIME (1 alone, 18 total)
Other free tools (0 alone, 15 total)
Microsoft SQL Server (1 alone, 15 total)
Zementis (5 alone, 13 total)
Oracle DM (0 alone, 9 total)
Statsoft Statistica (0 alone, 8 total)
Orange (0 alone, 5 total)
Salford CART, Mars, other (1 alone, 5 total)
C4.5/C5.0 (0 alone, 4 total)
Angoss (0 alone, 4 total)
Inference for R (0 alone, 3 total)
Viscovery (0 alone, 2 total)
Megaputer (0 alone, 2 total)
Insightful Miner/S-Plus (now TIBCO) (0 alone, 2 total)
Bayesia (1 alone, 2 total)
Thinkanalytics (1 total)
Miner3D (1 total)
Clario Analytics (1 total)
+ نوشته شده در سه شنبه هجدهم خرداد 1389ساعت 12:4 توسط مهدی نصیری |

در ارشیو دی ماه چند نمونه سوال است که برای امتحان ممکن است به درد بخورد.

برای تحلیل یک بیماری یا پیش بینی ان ایا می توان با داده کاوی انجام داد؟ چگونه؟

نقاط قوت و ضعف الگوریتم نزدیکترین همسایه را بنویسید

روش اموزش الگوریتم نزدیکترین همسایه را تشریح کنید. نویز و برون هشته چه اثری روی ان دارد

برای داده زیر یک درخت تصمیم برای پیش بینی فیلد اخر محاسبه کنید. جینی و جین ان را بدست اورید

+ نوشته شده در پنجشنبه سی ام اردیبهشت 1389ساعت 14:5 توسط مهدی نصیری |

1-دانشجوياني كه نام انها در ليست است موضوع انها پذيرفته شده است.

2-موضوعات به يك مقاله اكتفا نمي شود و حداقل يك موضوع جديد علاوه بر تسلط كامل بر موضوع بررسي مي شود

3- دانشجوياني كه از مقاله هاي پيشنهادي انتخاب مي كنند بايد از قابل پياده سازي بودن ان اطمينان حاصل كنند

1- حسين سهلاني Image Retrieval Based on Multi-Texton Histogram

2-عذرا اريانيا fiut: a new method for mining frequent itemset

3-ابراهيم امامي- تصوير كاوي:روشها و پيشرفتها

4-amulti agent data werhousing and ...

5- ابراهيم شيراني تغییر مفهوم در داده های جریانی و روش های مختلف تشخیص و هندل کردن آن

6- جليل قويدل combination of multiple classifiers using local accuracy estimates

7- مجتبي نجفي stream data

8-محمد حسين ميرهاشمي web mining agent

9- رضا اكبري image retrieval i multimedia database

10- سيد مهدي حسيني factored language modeling

11-بهناز قیدر

data mining using rule extraction from kohonen self-organising maps

12- وحيد قنبري Data mining in course management systems: Moodle case
study and tutorial

13- فرشته جعفري Semi-supervised Learning for SVM-KNN

۱۴-محمد صادق رسولی An effective refinement strategy for KNN text classifier
۱۵- میر هاشمی complementing search engines with online web mining agents

۱۶-ناهید پورسلیمان

18-فاطمه جعفری Semi-supervised Learning for SVM-KNN

19-هادی ملک پور خلاصه سازی متون

20- هادی شریفی fp-g*

21-احسان كوزه گر USING IMAGE MINING FOR IMAGE RETRIEVAL

+ نوشته شده در شنبه چهارم اردیبهشت 1389ساعت 11:18 توسط مهدی نصیری |

مطالب قدیمی‌تر