开端Java机械进修的最佳工具是甚么?
这个成绩曾经有一段时间了,但近来这些日子险些每个人都在评论辩论人工智能和机械进修。这曾经再也不是一个保留给科学家和研究者的机密,而是险些完成于每一项新兴技巧中。
鄙人面的章节中,咱们会做一个java的机械进修的重要框架的疾速概述,并证实Java机械进修是何等轻易上手,不必要你重新努力别辟门户或许从头开端创立算法。
人类的人工智能
人工智能在一段时间以来是一个普遍而且炫酷的范畴,但老是感到有点难以涉及,是特别为科学家所做。假如你想发明一个人工智能体系,你必需完成你自己的焦点算法,而且练习它们能辨认形式,懂得图象而且处置自然说话。
近来对付这范畴的蜕变使得其对付非研究者能更轻易涉及。你如今能轻易涉及到相干算法和工具。你不必要晓得你正在做甚么,然则能很轻松的晋升你应用的机械进修才能。
让机械运行
为了更简单的论述,咱们决议选出3个名目赞助你开端:
1.Deeplearning4J (DL4J) –开源,分布式,JVM的贸易深度进修lib库
2. BID Data Project –可以或许运行疾速、大规模的机械进修和数据挖掘的形式聚集
3. Neuroph –面向工具的神经收集
趁便说一下, 咱们近来宣布了别的一些吸引咱们留意的风趣的开源GitHub库. 下载.
DL4J – 深度进修
DL4J是一个能赞助你设置装备摆设多层神经收集的工具。它为JVM供给了深度进修且随同疾速原型计划和大规模定制,同时重视比设置装备摆设更多的商定。
这个工具是为了赞助曾经领有创立和应用神经收集的实践,但不想亲身完成算法的那些人。你可以或许在海量数据上办理特定成绩和自定义神经收集属性。
DL4J 是由Java说话编写的,可以或许兼容任何JVM说话好比 Clojure, Scala, ,Kotlin,而且可以或许与Hadoop和Spark集成。
能够的应用案例包括评估或保举体系如(CRM,adtech, churn prevention),猜测阐发乃至讹诈检测。假如你要探求实在的案例,你可以或许下载 Rapidminer. 这是应用DL4J的开源平台,用来为用户简化猜测阐发进程。
创立一个新的神经收集犹如创立一个新名目同样轻易。
BID Data Project (大数据名目)
大数据名目是由那些必要处置大批数据而且对机能敏感的人创立的。 UC Berkeley名目是由很多硬件、软件和计划形式聚集而成,能在上应用疾速、大规模的数据挖掘。
第一个库是 BIDMach,在单节点或集群上的惯例机械进修成绩都有记载。你可以或许应用这个库治理数据源,在CPU或许GPU上优化、分派数据。
BidMach 外面包括很多流行的机械进修算法,他们团队正致力于开辟分布式神经收集、图形算法和其余模子
其余两个库分别是BIDMat和 BIDParse。BIDMat是存眷与数据挖掘的疾速数学矩阵库,BIDParse是GPU加快的自然说话剖析。大数据名目标其余类库还包括可视化工具,可以或许支撑在Spark乃至在安卓运行的类库。
BIDMach基准比其余办理计划持续表现出更好的成果。乃至将其在繁多机械上的运行与其余计划在大集群上的运行比拟也是如斯。在这里可以或许找到一个完备的基准列表。
Neuroph
neuroph是用来开辟常用的神经收集构架的轻量级java框架。该框架供给了一个java库和一个GUI工具(称为easyNeurons),你可以或许用它来在java名目中创立和练习自己的神经收集。
Neuroph包括一个开源的java类库和大批对应根本神经收集观点的基类。对付刚开端应用神经收集,或许想晓得它们若何事情的人来讲,Neuroph是个异常好的垫脚石。
你可以或许测验考试Neuroph的在线演示,看看它是怎样运行的。提醒:界面看起来很旧且过期,但你可以或许用它来创立美好的器械。它还得过2013的 Duke’s Choice的奖项。

收集视图
其余名目若何呢?
万一以上三个名目不是你所必要的,你想为你的名目探求一些分歧的,也不要紧。假如你在GitHub上搜刮“机械进修”,将有1506个Java资本让你找到适合的工具。
举个例子, Airbnb中有个风趣的名目是aerosolve,一个计划成具备人类友爱性的机械进修库。
开端进修一项新的技巧很费事,假如您希冀获得一些赞助,确保你曾经下载了Takipi的差错阐发工具。
最后的思虑
每隔几年就会有些对付人工智能的新声响。这一次,它伴跟着机械进修,数据挖掘,神经收集等等的强化来了,咱们都很支撑。这些类库开源的现实意味着这些信息和才能正奇货可居,而你一切所做的是思虑领有这个才能可以或许做成甚么。
假如你晓得其余风趣的名目或许你觉得咱们遗漏点甚么,咱们等待鄙人面的批评里见到它们。