subtitle
12
02
Triton-MLIR Triton-MLIR
Triton-MLIR: Memory Coalesce [toc] Memory Coalesce是一个通用优化手段并不局限于Triton,以CUDA中访存通常会以一个Warp为单位进行,如果同一个Warp内多个线程的访存操作是连续的,那
2023-12-02 Paranoid
08
05
MLIR Toy Tutorial MLIR Toy Tutorial
MLIR Toy Tutorial 1. Toy and AST Toy语言,一个基于tensor的语言,可以定义函数,执行一些数学运算和输出结果。简单起见,tensor的rank <= 2,只有f64一种类型,并且值不可修改,需要新
2023-08-05 Paranoid
04
The Great Ideas in CS The Great Ideas in CS
Program Analysis Books Static Program Analysis Program Analysis Courses ⭐NJU : Static Program Analysis | Fall 2021 CM
2023-08-04 Paranoid
06
24
03
13
10
05
git提交冲突问题 git提交冲突问题
git提交冲突问题 远程仓库和本地仓库同时有修改时,此时git push会产生冲突。例如下图 执行git push origin master后显示冲突。这个错误是因为远程仓库包含了本地仓库没有的提交,通常是由于其他人在同一个分支上推送了代
2023-03-05
02
ANTLR4构建AST ANTLR4构建AST
Challenge:使用ANTLR4构建AST 1.定义语法规则 编写Calculator.g4文件,如下 grammar Calculator; prog : stat+ ; stat : expr NEWLINE
2023-03-02
01
10
猫狗大战 猫狗大战
猫狗大战 通过来自 kaggle 上的猫狗数据集,训练一个识别猫狗图片的分类器。要求 设计一个使用 ResNet18 作为主干的卷积神经网络,在迁移网络时采用固定值模 式,要求模型的准确率不低于 90%。猫狗大战数据集训练集有 25000
10
正弦函数预测 正弦函数预测
正弦函数预测 通过已知的样本数据对正弦函数进行预测,并绘制出图形。设计 LSTM网络进行预测,记录预测准确率并绘制图形。 1.准备数据 import torch import torchvision.datasets as datasets
2023-01-10
10
CIFAR-10分类网络 CIFAR-10分类网络
CIFAR-10分类网络 通过 CIFAR-10 数据集训练得到一个彩色图像分类网络。要求设计一 个至少包含 5 个卷积层和池化层的卷积神经网络。卷积核的尺寸统一采用 3*3, 要求训后的得到的网络在测试集上的准确率不低于 70%(要求在网
2023-01-10
10
手写数字识别器 手写数字识别器
手写数字识别器 通过 MNIST 数据集训练得到一个手写数字分类器。要求设计一个至 少包含 2 个卷积层和池化层的卷积神经网络。卷积核的尺寸不小于 5*5,要求训 后的得到的网络在测试集确率不低于 96%(要求在网络中使用 dropout)
2023-01-10
1 / 3