蚂蚁的AI学习练习

从概念到原理，再到应用，再到实践中知道价值 1 万美金的线画在哪里，最后到找到能画出线的人，时间消耗从 100 小时到 1000 小时再到 10000 小时，乃至一生。。。

flowchart LR
    A[开始] --> B[Know What]
    B --> C[Know How]
    B --> D[Know Why]
    C --> E[Know Where]
    D --> E
    D --> F[Know When]
    C --> F
    E --> G[Know Who]
    F --> G

个人5 年内目标

精通空间智能，比如NeRF, 3DGS等空间计算和空间视频的处理与生成，为元宇宙即下一阶段的 AI 应用打下基础，越过目前一维、二维和三维数据的匮乏，预先抢位智能时代。

空间智能是AI的下一阶段，是继LLMs大语言模型之后的第二个台阶，是通往AGI的必经之路。

What is spatial intelligence?

Initially we will focus on generating 3D worlds without limits - creating and editing virtual spaces complete with physics, semantics, and control. We hope this will unlock new capabilities for creative users and professionals such as artists, designers, developers, and engineers. It will also allow anyone to imagine and create their own worlds, expanding the potential of generative AI from 2D images and videos to 3D worlds.

蚂蚁个人觉得，以人类幼崽从小通过视觉学习的过程来看，通过视觉空间数据来逐步强化学习、训练构造神经网络是个可能的通往AGI的道路，目前AI的观察世界的方式是语言文字资料，这与人类恰恰相反，读书认字其实是智能发展到后期的一种社会实践活动，那么，有没有可能，让AI自行构造神经网络结构？自行通过视觉数据来修改网络权重？可以给AI一个睡觉的时间，构造它的海马体和更多的硅基大脑部分？

蚂蚁现在还不是很懂细节，希望通过一年的努力，看能不能找到一条道路，实现以下几个课题：

课题1

通过摄像头强化学习的MNIST手写文字识别神经网络

课题2

写一个手机APP，界面分上下两部分，上面的部分为摄像头画面，下面的部分为通过上一帧预测生成的画面，画面会和手机重力传感器同步。

用这个课题来进入到具体的空间智能实现，研究以下问题：

如何通过上一帧预测下一帧画面
如何通过对比摄像头下一帧画面让模型强化学习
如果把训练过程和推理过程通过强化学习的方式结合起来
如何让摄像头学会认物体，就像教小孩子一样

最终达到上下画面完全一致，摄像头的思考过程用文字的方式显示出来，这个课题项目的代号 BigEyeZero

参考：

Exact Volumetric Ellipsoid Rendering for Real-time View Synthesis

推荐信息源：资料日日新

归藏的AIGC Weekly

论文阅读

https://www.aminer.cn/ 智谱出品
https://papers.cool/ 苏神出品

编程

Python

需要了解基本的Python语法，了解Numpy、Pandas、Matplotlib、PyTorch和TensorFlow等库的基本用法

蚂蚁写的Python基础教程

数学

《程序员数学》

线性代数

3Blue1Brown

概率论

机器学习理论

深度学习入门

Neural Networks and Deep Learning

Transformer

Name		Name	Last commit message	Last commit date
Latest commit History 51 Commits
aiEnglish		aiEnglish
books		books
data		data
dataset		dataset
media		media
notes		notes
.gitignore		.gitignore
README.md		README.md
ds8b.sh		ds8b.sh
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

蚂蚁的AI学习练习

个人5 年内目标

课题1

课题2

推荐信息源：资料日日新

推荐书目：

道

术

器

论文阅读

编程

Python

数学

线性代数

概率论

机器学习理论

深度学习入门

Transformer

LLM Visualization

Diffusion

工具

练习环境

数据集

扩展阅读

About

Releases

Packages

Languages

twinsant/ML

Folders and files

Latest commit

History

Repository files navigation

蚂蚁的AI学习练习

个人5 年内目标

课题1

课题2

推荐信息源：资料日日新

推荐书目：

道

术

器

论文阅读

编程

Python

数学

线性代数

概率论

机器学习理论

深度学习入门

Transformer

LLM Visualization

Diffusion

工具

练习环境

数据集

扩展阅读

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages