龙空技术网

用JavaScript的Brain.js训练人工智能神经网络来识别手写数字

三维棱镜 1629

前言:

如今大家对“html数字加载”可能比较看重,同学们都想要剖析一些“html数字加载”的相关知识。那么小编也在网摘上搜集了一些关于“html数字加载””的相关内容,希望我们能喜欢,我们一起来学习一下吧!

Introduction 介绍

人工智能和机器学习是软件开发的一个令人兴奋的新前沿。虽然新的工具,网站和其他资源不断涌现,但其中大多数都是用Python(或者R)编写的。如果你是一个前端开发人员(他最喜欢的语言可能是JavaScript),你可能会想知道你是否有可能探索这个新世界。

幸运的是,这个问题的答案是肯定的。有一些库可以让你在不了解Python一行的情况下练习机器学习。在本教程中,我们将探讨其中之一 - 大脑.js - 并展示如何构建,训练和使用只有JavaScript的深度神经网络(DNN)。

Learning objectives 学习目标

我们将逐步完成一个预构建的 DNN。我们将展示它如何从 UI 中工作,深入研究将 UI 连接到 DNN 的代码,然后解释实际创建和训练 DNN 的代码。然后,我们将回过头来解释 DNN 是什么、它们如何工作以及人们如何创建和改进它们的一些基本概念。在此过程中,我们将发现DNN如何使我们能够以令人惊讶的少代码获得令人印象深刻的结果。

Prerequisites 前置条件准备

本文假定您之前没有 DNN 或机器学习方面的经验

For the tutorial, you will need:

Basic familiarity with JavaScript 对脚本的基本熟悉程度Basic familiarity with Git and GitHub 对 Git 和 GitHub 的基本熟悉程度

步骤1. Draw and predict

克隆存储库后,在所选浏览器中打开数字计算器.html文件。加载时,您应该会看到以下内容。

这是数字预测应用程序的 UI,该应用程序使用 DNN 来猜测您在其网格中绘制的内容。

尝试在网格中绘制一个数字;它可以是 0 到 9 之间的任何值(仅限一位数字)。您可以通过单击网格中的正方形,按住鼠标左键并拖动它来绘制数字,完成后释放。

绘制完某些内容后,单击“获取评估”按钮。这样做应该会产生如图 2 所示的反馈。

若要进行其他预测,请单击“清除输入”按钮并在网格中绘制另一个数字,然后再次单击“获取评估”。

Here's what just happened 这是刚刚发生的事情

希望到现在为止,您已经对此程序的工作原理很感兴趣。到目前为止,您已经与预先训练的 DNN 进行了交互。

在非常基本的层面上,您正在创建输入 - 您绘制的数字 - 并将其馈送到DNN。反过来,DNN正在使用它以前教授的内容(稍后会详细介绍)来进行有根据的猜测或预测。代码在 UI 中显示此预测,并添加了一些详细信息,例如黄色突出显示,以使网络的选择更加明显。

步骤2. 使用Brain.js 库构建DNN训练

我们现在将演练代码,以便您可以看到使用大脑.js库在JavaScript中实现DNN是什么样的。完成此操作后,我们将退后一步,更广泛地讨论 DNN 的工作原理,并回顾我们看到的代码,以将其全部联系在一起。

当我们单击“获取评估”按钮时,我们可以看到它调用了一个名为getAssessment():

<button onclick="getAssessment()" style="width:49%;">    Get Assessment</button>

当我们在数字计算器.html文件中向下滚动时,我们可以看到 getAssessment() 的定义:

function getAssessment() {    const inputArray = captureAndTransformInput()    let ourNetwork = ourNeuralNetwork    const result = arrayToHTML(resultToArray(ourNetwork.run(inputArray)))    document.getElementById('assessment').innerHTML = result}

getAssessment() 函数是我们创建的,因此我们的 UI 可以与大脑.js库创建的 DNN 对象进行通信(稍后会详细介绍)。

如果要使用 DNN,我们需要做的第一件事就是获取有关我们在屏幕上绘制的内容的数据。我们需要给 DNN 一些要检查的东西。我们使用为演示创建的另一个函数来执行此操作,该函数称为捕获和转换输入()。此函数循环访问我们网页上的网格,并检查哪些框被涂成红色,哪些框没有。然后,它采用所有这些数组,并将整体转换为 1 和 0 的数组,并返回结果:

function captureAndTransformInput() {    const boxes = Array.from(document.getElementsByClassName('cell'))    const toOnesOrZeros = box => box.style.backgroundColor === 'red' ? 1 : 0    return boxes.map(toOnesOrZeros)}

我们需要执行此转换,因为 Brain.js 库提供给我们的 DNN 将不知道如何处理原始数据(来自 HTML 页面的颜色信息)。我们的 DNN 只知道如何处理 1 和 0 的列表。

使用深度学习术语,我们正在使用捕获和转换输入函数为我们的 DNN 创建一个输入向量。

步骤 3. 使用DNN 来判断准确度

所有 DNN 都需要一个输入向量来完成其工作。即使是你可能听说过的神经网络示例,例如那些处理照片以确定它们是否包含猫或狗的示例,也不能直接处理照片。

相反,脚本(通常是Python)从照片中获取像素信息并将其解卷成一长串值,这些值通常是表示照片中每个像素的每个RGB值的不同部分的数字。结果称为输入向量,对于照片,它可以包含许多值。我们正在对捕获和转换输入()执行类似的操作,尽管更简单。

现在我们有了输入向量,我们可以使用 DNN 对刚刚绘制的内容进行分类,并确定其准确性。

使用 Brain.js库时,将创建一个包含有关 DNN 的信息的对象。此对象的一个方面是名为 run() 的方法。这就是实际生成的预测,最终在我们看到的网页上结束:

ourNeuralNetwork.run(...)

但在我们实际使用我们的 DNN 对象之前,我们必须先训练它并设置一些参数。我们很快就会解释这一点,但现在我们将继续看到网络的预测如何将其返回到网页。

brain.js run() 方法将输入向量作为参数并返回结果。此结果是一个 JSON 有效负载,其中包含有关 DNN 对我们绘制的数字的有根据的猜测的信息。在我们的教程中,我们将captureAndTransformInput()函数的输出提供给run()方法:

const inputArray = captureAndTransformInput()const result = arrayToHTML(resultToArray(ourNeuralNetwork.run(inputArray)))The output of the run() method - i.e., our network’s prediction - is then passed to another “transformer” function we have created called resultToArray():function resultToArray(resultToConvert) {    let arrayToReturn = []    arrayToReturn.push({ label: 'Zero', likelihood: resultToConvert.Zero, topChoice: 0, ordinal: 0 })    arrayToReturn.push({ label: 'One', likelihood: resultToConvert.One, topChoice: 0, ordinal: 1 })    arrayToReturn.push({ label: 'Two', likelihood: resultToConvert.Two, topChoice: 0, ordinal: 2 })    arrayToReturn.push({ label: 'Three', likelihood: resultToConvert.Three, topChoice: 0, ordinal: 3 })    arrayToReturn.push({ label: 'Four', likelihood: resultToConvert.Four, topChoice: 0, ordinal: 4 })    arrayToReturn.push({ label: 'Five', likelihood: resultToConvert.Five, topChoice: 0, ordinal: 5 })    arrayToReturn.push({ label: 'Six', likelihood: resultToConvert.Six, topChoice: 0, ordinal: 6 })    arrayToReturn.push({ label: 'Seven', likelihood: resultToConvert.Seven, topChoice: 0, ordinal: 7 })    arrayToReturn.push({ label: 'Eight', likelihood: resultToConvert.Eight, topChoice: 0, ordinal: 8 })    arrayToReturn.push({ label: 'Nine', likelihood: resultToConvert.Nine, topChoice: 0, ordinal: 9 })    const byLikelihood = (x, y) => x.likelihood < y.likelihood ? 1 : -1    const byOrdinal = (x, y) => x.ordinal < y.ordinal ? -1 : 1    const topChoiceDesignation = (e, i, a) => {        e.topChoice = i === 0 ? 1 : 0  // mark the first entry (index 0) as the top choice - we can do this because we've already sorted them to ensure that the top choice is the first item         return e    }    return arrayToReturn.sort(byLikelihood)        .map(topChoiceDesignation)        .sort(byOrdinal)}

此函数接收预测数据(结果到转换)并创建一个新数组(数组 ToReturn),其中包含可用于在 UI 中显示结果的信息。我们的 DNN 返回的输出将是一个具有 10 个属性(零、一、二、三、四、五、六、七、八、九)的对象,每个属性都有映射到它的概率(介于 0 和 1 之间)。

因此,例如,来自 DNN(结果到转换参数)的预测有效负载可能如下所示(我们的 DNN 非常确信,无论它所看到的是什么,都是数字 4):

// a possible payload for resultToConvert - this data came from the DNN{    Zero: 0.1927014673128724,    One: 1.588071696460247,    Two: 0.09038684074766934,    Three: 0.0014367527001013514,    Four: 94.81642246246338,    Five: 0.8259298279881477,    Six: 0.10091685689985752,    Seven: 0.46726344153285027,    Eight: 0.30299206264317036,    Nine: 41.01988673210144}

我们使用此输出来构建一个新数组,其中每个项目都有一个标签属性(我们创建并分配单词值,如“Zero”,“One”等),一个可能性属性(存储从该项的神经网络接收的概率),一个topChoice属性(我们计算)和一个序号属性(我们为其赋值, 如 0, 1, 2-9)。

我们按可能性对数组进行排序,以确定 DNN 的首选,然后使用此信息用 1(真)或 0(假)标记该项目的 topChoice 属性。作为最后一步,我们采用新构造的数组并将其馈送到最终函数 - arrayToHTML() - 该函数将此信息包装在HTML标记中:

function arrayToHTML(arr) {    let htmlToReturn = ''    htmlToReturn = arr.map(x => {        let styleToUse = x.topChoice === 1 ? 'background-color: yellow;' : ''        return `<div style="${styleToUse}">${x.label} Confidence: ${x.likelihood * 100}%</div>`    }).join('')    return htmlToReturn;}

除其他操作外,此函数还对它收到的每个项目执行检查,以确定其 topChoice 属性是否为 1。如果是,则用黄色标记包装项目。这是我们在网页上看到的突出显示。

有了这个,我们已经看到了从UI到DNN(作为用户输入)和再次返回(作为中继到UI的DNN输出)的完整往返。

步骤4. 建立 Brain.js 神经网络对象Set up Brain.js neural-network object

早些时候,我们指出,Brain.js库使我们能够创建的DNN对象需要一些设置才能使用它。我们将在这里详细讨论这个问题。

number-evaluator.html文件中,我们创建了一个名为 activate() 的函数。当 HTML 文档最初加载时,这将触发,并且我们在此函数中定义、创建和训练 DNN。

我们通过调用 Brain.js库中的 NeuralNetwork() 方法来做到这一点,就像这样(brain是我们从 Brain.js 库的本地副本中可用的变量,存储在本地brain.js文件中):

// setting up a BrainJS DNN object with two specified hyper parametersourNeuralNetwork = new brain.NeuralNetwork({    activation: 'sigmoid',    learningRate: 0.1})

Hyper parameters 初始参数

当数据科学家和机器学习工程师创建神经网络时,他们通常需要提供一组初始值,用于说明网络在训练时的运行方式。这些初始值或参数称为超参数。

它们控制神经网络调整学习方式的速度,在其隐藏层中使用哪种操作,以及许多其他方面。在其他语言和设置中,我们通常需要提供许多超参数来训练神经网络。然而,有了Brain.js,我们根本不需要提供任何东西。如果省略任何超参数,该库将提供默认值。

在上面的示例中,我们指定了两个超参数。第一个是一个名为激活的参数,我们已将其设置为 sigmoid。激活函数是神经网络在其隐藏层中执行的东西,用于处理从一层到下一层的输入。它们对于帮助神经网络学习至关重要,因为它们有助于控制哪些节点应该继续触发,哪些节点应该在每一层中保持沉默。乙状体是一种激活函数。我们可以使用许多品种(ReLU,谭等)。每个激活函数都有自己的优点和缺点。使用 sigmoid 对于分类之类的事情特别有用,这是我们在本教程中要实现的目标。

我们指定的另一个超参数是学习速率。学习速率决定了神经网络在尝试创建有用的预测模型时(即,当它试图学习如何区分3和7时)调整其值的速度(或速度)。

指定学习速率,就像指定其他超参数一样,既是艺术,也是科学:如果将速率设置得太低,您的网络可能需要不可接受的时间来训练,例如,如果您在云服务上租用GPU,这可能会产生真正的财务后果;如果您将速率设置得太高,您的网络可能永远不会收敛到所谓的“全局最小值”(解决方案)。

时间和实践将使您能够掌握良好的初始值是什么样子的。

步骤5.训练神经网络 Training our neural network

我们一直在谈论神经网络的学习以及我们必须如何训练它,但这意味着什么,它看起来是什么样子的?在我们的教程应用程序的上下文中,培训如下所示:

const ourTrainingData = getTrainingData()ourNeuralNetwork.train(ourTrainingData)

训练是 DNN 工作原理的基础。通常,它的完成方式是使用监督学习方法:我们提供一个数据集,其中包含示例输入和答案(或标签,有时也称为真实标签),用于描述该数据行的正确分类。当我们训练一个DNN(大脑.js允许我们从有用的命名train()方法开始,它使用这些标签来帮助它学习。

步骤 6. 准备训练数据Train the data

查看 getTrainingData() 函数,我们可以知道DNN具体是如何工作的。

Brain.js允许我们通过训练数据来指定我们的输入数据将是什么样子的,以及我们希望从神经网络中看到什么样的输出。它的主要要求是我们提供输入和输出属性。有关详细信息,请参阅“训练选项”下的“大脑.js GitHub 存储库”。

下面是训练数据样例

{ "input": [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],     "output": {         Zero: 1,         One: 0,         Two: 0,         Three: 0,         Four: 0,         Five: 0,         Six: 0,         Seven: 0,         Eight: 0,         Nine: 0         }     }

训练识别概率

{    Zero: 0.1927014673128724,    One: 1.588071696460247,    Two: 0.09038684074766934,    Three: 0.0014367527001013514,    Four: 94.81642246246338,    Five: 0.8259298279881477,    Six: 0.10091685689985752,    Seven: 0.46726344153285027,    Eight: 0.30299206264317036,    Nine: 41.01988673210144}

自己创建训练数据

通过手写板准备数据,

Summary 总结

本文中,我们展示了如何使用 JavaScript 实现和训练 DNN,这要归功于brain.js库 - 通常需要 Python 和 Keras、Pytorch 或 TensorFlow 等库的任务。

我们证明了一个有效的数字识别器可以用令人惊讶的少代码创建。我们学习了机器学习的一些基本构建块和实践,例如为DNN指定学习速率和激活函数(以及其他超参数)。

希望本文已经向您展示,在没有经验的情况下开始使用AI和机器学习不仅是可能的,而且在像JavaScript这样的熟悉语言中也是可行的。

标签: #html数字加载