文件系统¶
集群上存在本机目录、共享目录和统一命名空间。提交跨节点作业时,工作目录必须是所有参与节点都能访问的路径。
常用路径¶
路径 |
用途 |
说明 |
|---|---|---|
|
用户工作目录 |
三台节点可见,适合放代码、脚本、小型结果。 |
|
共享资源 |
公共脚本、示例、管理员预置文件。 |
|
软件环境 |
管理员安装的公共软件。 |
|
数据集 |
共享数据集,写入前请确认规范。 |
|
临时数据 |
适合缓存、中间文件和容器临时数据。 |
建议¶
作业脚本、训练代码和配置文件放在
/cluster/home/<username>。大型临时文件放在
/cluster/scratch,任务结束后及时清理。不要把 SSH 私钥、API key、数据集授权文件放到他人可读目录。
不要在登录节点本地
/tmp或个人 home 中放跨节点作业依赖。
检查空间¶
df -hT /cluster
du -sh /cluster/home/$USER
权限¶
如果遇到 Permission denied,先检查:
id
ls -ld <path>
ls -l <file>
需要共享给同组成员时,优先使用管理员规划的共享目录,不要随意放宽个人目录权限。