AI工程师是怎么变成“调参狗”、“炼丹师”的

以前,提起AI,机器学习,神经网络,深度学习,Deep Learning这些名词,我和大家一样,觉得炫、牛X、高大上。
最近两三年来,陆陆续续完成了一些人脸识别、图片识别之类的项目后,终于理解了为什么AI工程师往往都自嘲为“调参狗”、“炼丹师”。
因为,AI工程师的主要工作内容,在最近两三年,发生了很大的变化。

以前搞AI,要自己研究算法,要移植或者编写大量的代码,对于不是专门搞机器学习的人来说,门槛是相当高。
现在不用那么麻烦了,算法和代码,基本是现成的,已经集成到主流的深度学习框架里了,像TensorFlow,MXNET,PyTorch,Caffe,NCNN等。
所以现在的AI工程师,工作内容已经由算法和代码,变成了调整参数和训练模型。正是这种变化,让AI工程师成了“调参狗”、“炼丹师”。

例如,搞人脸识别,先找个主流的深度学习框架,如NCNN;再找个效果最好的人脸识别算法,如InsightFace;两者搭配起来,算法和代码的工作就算完成了。
有了框架提供的算法和代码之后,AI工程师下一步的工作,是调整参数,和训练模型,或者直接下载使用别人已经训练好的模型。
调参、训练模型的过程,比较耗费精力和时间,这个过程也就是工程师自嘲的炼丹。

算法和框架,是丹炉。
就像IT人常说的一句话,不要重复制造轮子。同理,AI工程师不会重复制造丹炉。丹炉是现成的,最多调整调整参数,相当于改改火候。

训练模型用的图片、音视频等,是炼丹材料。
好的材料是炼丹成功的关键。在一定程度上来说,素材甚至比算法更重要。
就像人脸识别,算法差别不大,关键在于素材。如果你做的是一个用于识别中国人面孔的应用,但用来训练模型的人脸图片却都是欧美人的,效果一定不会好。

训练出的模型,就是炼出的丹药。

整个炼丹过程,往往不是一次成功,而是一个循环往复的过程:调整参数、输入素材、训练出模型,使用后发现效果不佳;继续调整参数,输入素材或者改变素材、训练出新的模型,检验使用效果;重复上述过程,直到满意为止,才算炼丹成功。
最后把算法、框架、模型,集成到项目里,工程化或者产品化,变成最终产品。

还有一些更省事的办法:
1、有一些在线AI平台,提供人脸识别、图片识别、文字识别等多种功能,大多采用API调用方式,可以很方便的集成到项目中,难度为0。
2、如果不喜欢第三方API服务,又想跳过调参、训练这些比较费工夫的步骤,可以直接下载和使用别人已经训练好的模型,集成到自己的项目里。

目前AI的智力水平,已经基本达到八九岁小孩的智力水平。
如果我们在工作或者生活中,遇到一些琐碎的,重复的,八九岁小孩的智力能解决的事情,可以考虑用AI来解决。例如,监控某个仪表的读数。