MobileSideBar

SEARCH

MENU

  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档

CATEGORIES

  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

NEWPOSTS

  • MoE环游记:5、均匀分布的反思
  • msign算子的Newton-Sc...
  • Transformer升级之路:2...
  • 一道概率不等式:盯着它到显然成立为止!
  • SVD的导数
  • 智能家居之手搓一套能接入米家的零冷水装置
  • Transformer升级之路:1...
  • 矩阵的有效秩(Effective ...
  • 通过梯度近似寻找Normaliza...
  • MoE环游记:4、难处应当多投入

COMMENTS

  • MiracleLpX: "RoPE不带有显式的远程衰减,这对于旨在Long Conte...
  • 苏剑林: 你可以从推理角度来理解,推理时是MQA,key是c与kr的拼接...
  • 苏剑林: 先确定sparsity($n$与$k$的比),然后细致一点的话...
  • 苏剑林: $\boldsymbol{\theta}$是生成器的参数,我主...
  • 苏剑林: 这就跟对$r$求微分一样操作呀。
  • 苏剑林: 谢谢,我还真忘记这茬了,已经补到正文里边去。
  • 苏剑林: 那也允许$\theta_1=\theta_0$呀?这是一种更一...
  • 苏剑林: 欢迎展示你的过程。
  • 苏剑林: 听说很多人验证过,scaleup上去之后就没收益了。
  • 苏剑林: 就是输出向量的模长变大或缩小。

USERLOGIN

  • 登录
科学空间|Scientific Spaces
  • 登录
  • 打赏
  • 公式
  • 天象
  • 链接
  • 时光
  • 博览
  • 归档
渴望成为一个小飞侠

  • 欢迎订阅

  • 个性邮箱

  • 天象信息

  • 观测ISS

  • LaTeX

  • 关于博主

欢迎访问“科学空间”,这里将与您共同探讨自然科学,回味人生百态;也期待大家的分享~

  • 千奇百怪Everything
  • 天文探索Astronomy
  • 数学研究Mathematics
  • 物理化学Phy-chem
  • 信息时代Big-Data
  • 生物自然Biology
  • 图片摄影Photograph
  • 问题百科Questions
  • 生活/情感Life-Feeling
  • 资源共享Resources
  • 千奇百怪
  • 天文探索
  • 数学研究
  • 物理化学
  • 信息时代
  • 生物自然
  • 图片摄影
  • 问题百科
  • 生活/情感
  • 资源共享

链接

  • Cool Papers
  • 数学研发
  • Seatop
  • Xiaoxia
  • 积分表-网络版
  • 丝路博傲
  • ph4ntasy 饭特稀
  • 数学之家
  • 有趣天文奇观
  • TwistedW
  • godweiyang
  • AI柠檬
  • 王登科-DK博客
  • ESON
  • 枫之羽
  • Mathor's blog
  • coding-zuo
  • 博科园
  • 孔皮皮的博客
  • 运鹏的博客
  • jiming.site
  • OmegaXYZ
  • Blog by Eacls
  • EAI猩球
  • 文举的博客
  • 用代码打点酱油
  • 申请链接

科学空间

微信打赏

科学空间

支付宝打赏

因为网站后台对打赏并无记录,因此欢迎在打赏时候备注留言。
你还可以点击这里或在下方评论区留言来告知你的建议或需求。

你也许还对下面的内容感兴趣

  • [2011]一睹“食”的风采
  • 生成扩散模型漫谈(三):DDPM = 贝叶斯 + 去噪
  • 当概率遇上复变:解析概率
  • 新词发现的信息熵方法与实现
  • 写在2013年即将逝去之际
  • 非对抗式生成模型GLANN的简单介绍
  • VQ的旋转技巧:梯度直通估计的一般推广
  • 6个派生优化器的简单介绍及其实现
  • BERT-of-Theseus:基于模块替换的模型压缩方法
  • 科学空间:2009年10月重要天象
发表你的看法
    1. «
    2. 1
    3. 2
    4. 3
    5. 4
    6. 5
    7. 6
    8. »
taho

November 8th, 2016

你好,我是TAHOROOM,以前的博客域名现在修改为taho.cc,旧域名暂时停止使用。给你添麻烦了,多谢!

回复评论
天文地理爱好者

January 5th, 2017

我的网站是介绍地理知识的,其中有一个栏目是专门介绍天文地理知识的。同时我也是有趣天文奇观的管理员之一,这个天文网站也有挂我的友情链接。我们都是致力于为大家提供公益性的,有趣的天文知识,希望我们之间也能互补、互助一下。(我已经在我的网站首页上挂上您的友链了)

回复评论
天文地理爱好者 发表于 January 5th, 2017

我的网址是:http://www.dili520.com
链接关键词可以写:天文地理知识

回复评论
苏剑林 发表于 January 6th, 2017

已经加上^_^

回复评论
天文地理爱好者 发表于 January 6th, 2017

非常感谢O(∩_∩)O好的

回复评论
郑梓权

January 6th, 2017

师兄,我的域名换成 myargs.space, 麻烦你换一下,谢谢

回复评论
liuwensi

February 25th, 2017

申请iuwensi1985@spaces.ac.cn 科学邮箱,谢谢版主啦

回复评论
godweiyang

October 7th, 2018

大神你的博客写的非常好啊,我许多数学方面的知识都是从你这儿学的。我是做自然语言处理的,可否给我加一个友链啊QAQ
我的博客是:https://godweiyang.com

回复评论
苏剑林 发表于 October 7th, 2018

已经添加

回复评论
ailemon

November 19th, 2018

大神你好!我是主要做语音识别和自然语言处理的,我对你的博客很感兴趣,写的非常好。
我的博客主要是写机器学习和其他计算机技术相关内容的,请问可否互相加一个友链呢?非常感谢~我这里的友链页面已经添加好链接啦。
我的博客是“AI柠檬”:https://blog.ailemon.me

回复评论
苏剑林 发表于 November 20th, 2018

客气了,已添加。

回复评论
Guangyuan

November 25th, 2018

同学,你好!我也在中山大学求学。你目前常在在南校区,还是东校区?我常在东校区。希望当面请教请教你些问题。不是一些具体的学术问题,主要是想请教些关于数学学习的建议。不知道是否方便加一下你的微信,我的微信号seizethepresent

回复评论
苏剑林 发表于 November 25th, 2018

南校区。右上角可以找到微信。

回复评论
张强

December 23rd, 2018

苏神,相互加下友链呗,我这里的友链已经添加好了.
我的博客https://drivingc.com

回复评论
苏剑林 发表于 December 23rd, 2018

好的~

回复评论
彭子良

December 23rd, 2018

聚星科技论坛 申请链接
msst.longlan.xyz

回复评论
小宋

May 27th, 2019

深度学习应用开发博客
yansongsong.cn
希望申请链接

回复评论
    1. «
    2. 1
    3. 2
    4. 3
    5. 4
    6. 5
    7. 6
    8. »
取消回复

1. 可以使用LaTeX代码,点击“预览效果”可查看效果;
2. 可以通过点击评论楼层编号来引用该楼层;
3. 网站可能会有点卡,如非确认评论失败,请不要重复点击提交。

关于站长

科学空间logo
苏剑林|BoJone,科学空间博主,【数学、天文、理论物理、写作、阅读、计算机、中国象棋、厨房】爱好者(但不专业)......目前32岁,还在单调递增。希望能一直在此分享科学之美~
你也许会关心:
  • 科学空间|Scientific Spaces 介绍
  • 科学空间QQ交流群:67729435
  • 科学空间微信交流群:spaces_ac_cn
  • 常见问题集:《科学空间FAQ》
  • 智能搜索

    支持整句搜索!网站自动使用结巴分词进行分词,并结合ngrams排序算法给出合理的搜索结果。

    热门标签

      生成模型 attention 优化 语言模型 模型 网站 概率 梯度 转载 微分方程 天象 矩阵 深度学习 分析 积分 python 力学 无监督 优化器 几何 扩散 节日 生活 文本生成 数论

    随机文章

    • 8天长假结束了
    • 曾被嫌弃的预训练任务NSP,做出了优秀的Zero Shot效果
    • 电偶极子浅探(1)
    • 从“0.999...等于1”说开来
    • 重温SSM(三):HiPPO的高效计算(S4)
    • Nyströmformer:基于矩阵分解的线性化Attention方案
    • 让研究人员绞尽脑汁的Transformer位置编码
    • 【NASA每日一图】火星上的奇形黑色陨石
    • 椭圆内的一根定长弦(化圆法)
    • 《为什么现在的LLM都是Decoder-only的架构?》FAQ

    最近评论

    • MiracleLpX: "RoPE不带有显式的远程衰减,这对于旨在Long Context的模型至关重要" 苏神这句话...
    • 苏剑林: 你可以从推理角度来理解,推理时是MQA,key是c与kr的拼接,c、kr都来自h,这样就很舒服...
    • 苏剑林: 先确定sparsity($n$与$k$的比),然后细致一点的话就是自行在小模型上做实验画sca...
    • 苏剑林: $\boldsymbol{\theta}$是生成器的参数,我主要关心生成器是否收敛。
    • 苏剑林: 这就跟对$r$求微分一样操作呀。
    • 苏剑林: 谢谢,我还真忘记这茬了,已经补到正文里边去。
    • 苏剑林: 那也允许$\theta_1=\theta_0$呀?这是一种更一般的写法。
    • 苏剑林: 欢迎展示你的过程。
    • 苏剑林: 听说很多人验证过,scaleup上去之后就没收益了。
    • 苏剑林: 就是输出向量的模长变大或缩小。

    友情链接

    • Cool Papers
    • 数学研发
    • Seatop
    • Xiaoxia
    • 积分表-网络版
    • 丝路博傲
    • ph4ntasy 饭特稀
    • 数学之家
    • 有趣天文奇观
    • TwistedW
    • godweiyang
    • AI柠檬
    • 王登科-DK博客
    • ESON
    • 枫之羽
    • Mathor's blog
    • coding-zuo
    • 博科园
    • 孔皮皮的博客
    • 运鹏的博客
    • jiming.site
    • OmegaXYZ
    • Blog by Eacls
    • EAI猩球
    • 文举的博客
    • 用代码打点酱油
    • 申请链接

    署名-非商业用途-保持一致 本站采用创作共用版权协议,要求署名、非商业用途和保持一致。转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议。
    © 2009-2025 Scientific Spaces. All rights reserved. Theme by laogui. Powered by Typecho. 备案号: 粤ICP备09093259号-1/2。