دانلود و نمایش مقالات مرتبط با داده کاوی::صفحه 1
بلافاصله پس از پرداخت دانلود کنید
نتیجه جستجو - داده کاوی

تعداد مقالات یافته شده: 472
ردیف عنوان نوع
1 Data Mining Strategies for Real-Time Control in New York City
استراتژی داده کاوی برای کنترل زمان واقعی در شهر نیویورک-2105
The Data Mining System (DMS) at New York City Department of Transportation (NYCDOT) mainly consists of four database systems for traffic and pedestrian/bicycle volumes, crash data, and signal timing plans as well as the Midtown in Motion (MIM) systems which are used as part of the NYCDOT Intelligent Transportation System (ITS) infrastructure. These database and control systems are operated by different units at NYCDOT as an independent database or operation system. New York City experiences heavy traffic volumes, pedestrians and cyclists in each Central Business District (CBD) area and along key arterial systems. There are consistent and urgent needs in New York City for real-time control to improve mobility and safety for all users of the street networks, and to provide a timely response and management of random incidents. Therefore, it is necessary to develop an integrated DMS for effective real-time control and active transportation management (ATM) in New York City. This paper will present new strategies for New York City suggesting the development of efficient and cost-effective DMS, involving: 1) use of new technology applications such as tablets and smartphone with Global Positioning System (GPS) and wireless communication features for data collection and reduction; 2) interface development among existing database and control systems; and 3) integrated DMS deployment with macroscopic and mesoscopic simulation models in Manhattan. This study paper also suggests a complete data mining process for real-time control with traditional static data, current real timing data from loop detectors, microwave sensors, and video cameras, and new real-time data using the GPS data. GPS data, including using taxi and bus GPS information, and smartphone applications can be obtained in all weather conditions and during anytime of the day. GPS data and smartphone application in NYCDOT DMS is discussed herein as a new concept. © 2014 The Authors. Published by Elsevier B.V. Selection and peer-review under responsibility of Elhadi M. Shakshu Keywords: Data Mining System (DMS), New York City, real-time control, active transportation management (ATM), GPS data
مقاله انگلیسی
2 Direct marketing campaigns in retail banking with the use of deep learning and random forests
کمپین های بازاریابی مستقیم در بانکداری خرده فروشی با استفاده از یادگیری عمیق و جنگل های تصادفی-2019
Credit products are a crucial part of business of banks and other financial institutions. A novel approach based on time series of customer’s data representation for predicting willingness to take a personal loan is shown. Proposed testing procedure based on moving window allows detection of complex, sequen- tial, time based dependencies between particular transactions. Moreover, this approach reduces noise by eliminating irrelevant dependencies that would occur due to the lack of time dimension analysis. The system for identifying customers interested in credit products, based on classification with random forests and deep neural networks is proposed. The promising results of empirical studies prove that the system is able to extract significant patterns from customers historical transfer and transactional data and predict credit purchase likelihood. Our approach, including the testing method, is not limited to banking sector and can be easily transferred and implemented as a general purpose direct marketing campaign system.
Keywords: Consumer credit | Retail banking | Direct marketing | Marketing campaigns | Database marketing | Random forest | Deep learning | Deep belief networks | Data mining | Time series | Feature selection | Boruta algorith
مقاله انگلیسی
3 Stay alert: Forecasting the risks of sexting in Korea using social big data
هشدار: پیش بینی خطرات جنسیت در کره با استفاده از داده های بزرگ اجتماعی-2018
Youth sexting, which is commonly defined as the intimate image sharing of persons under 18, is an emerging phenomenon that has garnered significant attention in South Korea and in particular, the South Korean government. Widely recognized for its potential to generate undue harm, the South Korean government has initiated a movement determined to block the participation of obscene content sharing between youths under the age of 18. While there may be different avenues to examine this phenomenon from, an approach notably absent from this list is the use of big data and data mining information produced via the dispersion of the Internet and social media. Using social big data, the study found that teenagers sexting in hopes of obtaining a higher volume of attention among friends; file sharing is more frequented than image distribution through sexting; and transactions without “adult pornography” and with “smishing” were the most influential in addressing the risks of sexting in South Korea. While big data and data mining do not make any inferences themselves, the benefits of analyzing social big data lies in its ability to incorporate a much larger volume of data and confirm the thoughts of a diverse range of participants.
Keywords: Social big data ، Data mining ، Youth sexting ، South Korea ، Trends and patterns
مقاله انگلیسی
4 Systematic survey of big data and data mining in internet of things
مرور نظاممند داده های بزرگ و داده کاوی در اینترنت اشیا-2018
In recent years, the Internet of Things (IoT) has emerged as a new opportunity. Thus, all devices such as smartphones, transportation facilities, public services, and home appliances are used as data creator devices. All the electronic devices around us help our daily life. Devices such as wrist watches, emergency alarms, and garage doors and home appliances such as refrigerators, microwaves, air conditioning, and water heaters are connected to an IoT network and controlled remotely. Methods such as big data and data mining can be used to improve the efficiency of IoT and storage challenges of a large data volume and the transmission, analysis, and processing of the data volume on the IoT. The aim of this study is to investigate the research done on IoT using big data as well as data mining methods to identify subjects that must be emphasized more in current and future research paths. This article tries to achieve the goal by following the conference and journal articles published on IoT-big data and also IoT-data mining areas between 2010 and August 2017. In order to examine these articles, the combination of Systematic Mapping and literature review was used to create an intended review article. In this research, 44 articles were studied. These articles are divided into three categories: Architecture & Platform, framework, and application. In this research, a summary of the methods used in the area of IoT-big data and IoT-data mining is presented in three categories to provide a starting point for researchers in the future.
Keywords: Internet of things , Systematic survey , Big data , Data mining
مقاله انگلیسی
5 ارزیابی کارایی تکنیک های طبقه بندی داده کاوی برای پیش بینی بیماری قلبی
سال انتشار: 2018 - تعداد صفحات فایل pdf انگلیسی: 6 - تعداد صفحات فایل doc فارسی: 12
بیماری قلبی ممکن است یکی از دلایل اصلی مرگ باشد. به علت فقدان دانش و تجربیات متخصصان درمورد علائم نارسایی قلب برای پیش بینی اولیه این بیماری، کار آسان برای تشخیص بیماری نیست. در نتیجه، پیش بینی مبتنی بر رایانه؛ مبتلایان به بیماری قلبی می تواند نقش مهمی را در تشخیص پیش از مرحله برای انجام اقدامات مناسب با توجه به بهبودی بیماران بازی کند. با این حال، انتخاب روش طبقه بندی مناسب داده کاوی می تواند به طور موثر پیش بینی مرحله اولیه بیماری را برای بازگشت از آن به همراه داشته باشد. در این مقاله، سه تکنیک طبقه بندی استفاده شده غالب از قبیل ماشین بردار پشتیبانی (SVM)، نزدیکترین همسایۀ k (KNN) و شبکه عصبی مصنوعی (ANN) را مورد بررسی قرار می دهیم، با توجه به ارزیابی آنها برای پیش بینی بیماری های قلبی با استفاده از مجموعه داده های بیماری کلیوی استاندارد مورد مطالعه قرار گرفته است.. نتایج تجربی نشان می دهد که دقت طبقه بندی با استفاده از SVM (85.1852٪) بهتر از استفاده از KNN (82663٪) و ANN (73.3333٪) است.
لغات کلیدی: داده کاوی | ماشین بردار پشتیبانی | نزدیکترین همسایۀ k | شبکه عصبی مصنوعی | پیش بینی بیماری قلبی | تکنیک های طبقه بندی
مقاله ترجمه شده
6 A distributed evolutionary multivariate discretizer for Big Data processing on Apache Spark
یک توزیع تکاملی چند متغیره برای پردازش داده های بزرگ در Apache Spark-2018
Nowadays the phenomenon of Big Data is overwhelming our capacity to extract relevant knowledge through classical machine learning techniques. Discretization (as part of data reduction) is presented as a real solution to reduce this complexity. However, standard discretizers are not designed to perform well with such amounts of data. This paper proposes a distributed discretization algorithm for Big Data analytics based on evolutionary optimization. After comparing with a distributed discretizer based on the Minimum Description Length Principle, we have found that our solution yields more accurate and simpler solutions in reasonable time.
Keywords: Discretizacion , Evolutionary computation , Big Data , Data Mining , Apache Spark
مقاله انگلیسی
7 Big Data Compliance for Innovative Clinical Models
مطابقت داده های بزرگ برای مدل های بالینی نوآورانه-2018
In the healthcare sector, information is the most important aspect, and the human body in particular is the major source of data production: as a result, the new challenge for world healthcare is to take advantage of these huge amounts of data de-structured among themselves. In order to benefit from this advantage, technology offers a solution called Big Data Analysis that allows the management of large amounts of data of a different nature and coming from different sources of a “computerized” healthcare, as there are considerable changes made by the input of digital technology in all major health areas. Clinical intelligence consists of all the analytical methods made possible through the use of computer tools, in all the processes and disciplines of extraction and transformation of crude clinical data into significant insights, new purposes and knowledge that provide greater clinical efficacy and best health pronouncements about past performance, current operations and future events. It can therefore be stated that clinical intelligence, through patient data analysis, will become a standard operating procedure that will address all aspects of care delivery. The purpose of this paper is to present clinical intelligence approaches through Data Mining and Process Mining, showing the differences between these two methodologies applied to perform “real process” extraction to be compared with the procedures in the corporate compliance template (the so called “Model 231”) by “conformance checking”.
Keywords: Big Data healthcare , Clinical intelligence , Data Mining , Process Mining , Business intelligence
مقاله انگلیسی
8 Data and knowledge mining with big data towards smart production
داده و دانش کاوی با داده های بزرگ به سوی تولید هوشمند-2018
Driven by the innovative improvement of information and communication technologies (ICTs) and their ap plications into manufacturing industry, the big data era in manufacturing is correspondingly arising, and the developing data mining techniques (DMTs) pave the way for pursuing the aims of smart production with the real-time, dynamic, self-adaptive and precise control. However, lots of factors in the ever-changing environment of manufacturing industry, such as, various of complex production processes, larger scale and uncertainties, more complicated constrains, coupling of operational performance, and so on, make production management face with more and more big challenges. The dynamic inflow of a large number of raw data which is collected from the physical manufacturing sites or generated in various related information systems, caused the heavy information overload problems. Indeed, most of traditional DMTs are not yet sufficient to process such big data for smart production management. Therefore, this paper reviews the development of DMTs in the big data era, and makes discussion on the applications of DMTs in production management, by selecting and analyzing the relevant papers since 2010. In the meantime, we point out limitations and put forward some suggestions about the smartness and further applications of DMTs used in production management.
Keywords: Big data , Data mining techniques (DMTs) , Production management , Smart manufacturing ,| Statistical analysis , Knowledge discovery
مقاله انگلیسی
9 داده و دانش کاوی با داده های بزرگ برای تولید هوشمند
سال انتشار: 2018 - تعداد صفحات فایل pdf انگلیسی: 13 - تعداد صفحات فایل doc فارسی: 45
مطابق با پیشرفت نوآورانه فناوری اطلاعات و ارتباطات (ICT) و کاربرد آنها در صنعت تولید، دوران بزرگ داده های تولیدی مطابق با انها است و تکنیک های داده کاوی (DMTs)، راه را برای دستیابی به اهداف تولید هوشمند با کنترل زمان واقعی، پویا، خود سازگار و دقیق فراهم می سازد. با این حال، بسیاری از عوامل در محیط همیشه در حال تغییر در صنعت تولید هستند، از جمله، فرآیندهای تولید پیچیده، مقیاس بزرگ و عدم اطمینان، محدودیت پیچیده تر، ترکیب عملکردی عملیات، و غیره، که تولید مدیریت را با چالش های بزرگی همراه می سازد. ورودی پویا تعداد زیادی از داده های خام که از مکان های تولید فیزیکی جمع آوری شده یا تولید شده است؛ در سیستم های مختلف مربوط به اطلاعات، موجب شد تا مشکلات سنگین اطلاعات بیش از حد فراهم شود. در واقع، بسیاری از DMT های سنتی هنوز به اندازه کافی برای پردازش داده های بزرگ در تولید مدیریت هوشمند نیستند. بنابراین، در این مقاله، توسعه DMT ها در دوران بزگی از داده ها را مورد بررسی قرار می دهیم و از سال 2010 با انتخاب و تجزیه و تحلیل مقالات مربوطه در مورد کاربرد DMT ها در مدیریت تولید بحث می کنیم. در عین حال، در این مقاله ما محدودیت ها را مطرح می کنیم و برخی از پیشنهادات را در مورد هوشمند بودن و کاربرد بیشتر DMT ها که در مدیریت تولید به کار می رود را ارائه می دهیم.
کلمات کلیدی: داده های بزرگ | تکنیک های داده کاوی (DMTs) | مدیریت تولید | تولید هوشمند | تجزیه و تحلیل آماری | کشف دانش
مقاله ترجمه شده
10 سیستم تشخیص نفوذ توزیع شده برای محیط های ابری بر اساس تکنیک های داده کاوی
سال انتشار: 2018 - تعداد صفحات فایل pdf انگلیسی: 7 - تعداد صفحات فایل doc فارسی: 16
تقریبا دو دهه بعد از ظهور انها؛ محاسبات ابری همچنان در میان سازمان ها و کاربران فردی در حال افزایش است. بسیاری از مسائل امنیتی همراه انتقال برای این الگوی محاسباتی شامل تشخیص نفوذ به وجود می اید. ابزارهای حمله و نفوذ با شکستن سیستم های تشخیص نفوذ سنتی (IDS) با مقدار زیادی از اطلاعات ترافیک شبکه و رفتارهای پویا پیچیده تر شده است. IDSs ابری موجود از کمبود دقت تشخیص؛ نرخ مثبت کاذب بالا و زمان اجرای بالا رنج می برد. در این مقاله ما یک یادگیری توزیع ماشینی بر مبنی سیستم تشخیص نفوذ برای محیط های ابری را ارائه می دهیم. سیستم پیشنهاد شده برای مندرجات در سمت ابری به وسیله اندازه همراه اجزای شبکه لبه از ابرهای ارائه شده است. اینها به ترافیک رهگیری شبکه های ورودی به لبه شبکه routers از از لایه فیزیکی اجازه می دهد. یک الگوریتم پنجره کشویی (sliding window) مبتنی بر زمان برای پیش پردازش شبکه گرفتار ترافیک در هر router ابری استفاده می شود و سپس در نمونه تشخیص ناهنجاری دسته بندی Naive Bayes استفاده می شود. یک مجموعه از گره های سرور کالا بر مبنی یک Hadoop و MapReduce برای هر نمونه تشخیص ناهنجاری از زمانی که تراکم شبکه افزایش می یابد؛ در دسترس است. برای هر پنجره زمانی؛ داده ترافیک ناهنجاری شبکه در هر طرف router برای یک سرور ذخیره سازی مرکزی هماهنگ شده است. بعد؛ یک طبقه بندی یادگیری گروهی بر مبنی یک Forest تصادفی برای اجرای یک مرحله دسته بندی چند کلاسه نهایی به منظور تشخیص انواعی از هر حمله استفاده می شود.
لغات کلیدی: سیستم های تشخیص نفوذ | محاسبات ابری | یادگیری ماشین | هادوپ | MapReduce
مقاله ترجمه شده
rss مقالات ترجمه شده rss مقالات انگلیسی rss کتاب های انگلیسی rss مقالات آموزشی