信息技术
绘制随机森林模型的Gini重要性
2024-11-26
gaoch
在随机森林模型中,mean decrease in gini index(也称为Gini重要性或基尼指数下降均值)用于衡量各特征对模型分类性能的贡献。
[…] 可以通过以下步骤绘制它:
[…] 假设使用的是 scikit-learn 的随机森林实现:
import matplotlib.pyplot as plt import numpy as np from …
阅读全文 →
使用 AI 优化 blogdown 的分类和标签
2024-11-26
gaoch
要遍历 blogdown 站点下的每个文章,并对 categories 和 tags 进行合并和优化,可以按照以下步骤操作:
[…] 读取文章文件:遍历站点目录,找到所有的文章(通常是 .Rmd 或 .md 文件),读取文件中的元数据(如 categories 和 tags)。
[…] 合并和优化元数据:对每篇文章的 categories 和 tags 进行合并,移除重 …
阅读全文 →
配置私有 Git LFS 服务器
2024-11-11
gaoch
在 Git 项目中使用大文件已经成为非常普遍的事情了,例如在 Hugging face 下面的仓库中这样的情况比比皆是。
为了能够“专业地”存储大文件,或许可以有以下几种方式:
[…] 要将 NAS 作为 Git LFS 服务器,关键是让 NAS 提供 HTTP 或 SSH 文件存储服务,并将其作为 LFS 对象的存储端点。具体步骤如下:
[…] 确保 NAS 服务器支 …
阅读全文 →
GitHub Webhook
2024-11-04
gaoch
使用 GitHub Webhook 自动更新个人网站。bio-spring.top 是我的个人网站,其源代码托管在 GitHub 上。通过使用 GitHub Actions 可以自动构建网站并部署到 GitHub Pages,实现自动更新网站在 gaospecial.github.io/bio-spring/ 上的展示。通过使用 netlify 可以实现自动更新网站在 netlify 服务器上的展 …
阅读全文 →
Posit Conf 2024
2024-11-01
gaoch
ℙosit 2024 会议视频的合集今天发布了。这是非常好的数据科学学习材料。视频有 100 多个。为了能够挑选感兴趣的视频,通过下载字幕的方法利用大模型对视频内容进行了总结。
总结内容列在这里备查。
[…] 这段视频内容主要介绍了杜邦公司在食品保鲜、水资源利用和废物价值提升等方面的创新努力,强调了其实现碳中和目标的决心。杜邦设定了到2050年实现全面碳中和的目标,并展示了如何通过各 …
阅读全文 →
Random Surface
2024-08-11
gaoch
在 R 中生成 2 个向量,将其相乘后获得的矩阵,用 3D 绘图出来。生成向量时,加入正弦信号和随机扰动。绘图使用可交互的方式。添加噪声的时候,使用多个不同振幅、频率的正弦信号叠加的方式。
[…] 首先,确保你已经安装并加载了 plotly 包:
# install.packages("plotly") library(plotly) ## Loading …
阅读全文 →
dplyr::filter() 中的表达式
2024-01-11
gaoch
𝕕plyr 中的骚操作。
今天遇到的这个问题,让我困惑了好半天。
给出一个 tibble,对它执行 filter() 操作。
library(dplyr) ## ## Attaching package: 'dplyr' ## The following objects are masked from 'package:stats': ## ## filter, lag ## The …
阅读全文 →
Mac OS 安装 PicGo 提示“文件已损坏”
2023-12-29
gaoch
安装完成后,打开终端,运行下面的命令。
sudo xattr -d com.apple.quarantine "/Applications/PicGo.app/"
这个命令的作用是删除指定文件或目录的扩展属性(extended attributes)中的“com.apple.quarantine”属性。在 macOS 中,文件或应用程序首次从互联网上下载并存储在磁盘上时,系统可 …
阅读全文 →