일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- github
- 코테준비
- 라섹 수술 후기
- 다이어트
- 개인 운동
- 개인 PT
- 데드리프트
- 코드
- 코테 공부
- 건강
- 디버깅
- 바디프로필
- Knowledge Tracing
- 바프준비
- 프로그래머스
- 연구 시작
- 영화 비평
- 논문 리뷰
- 티스토리챌린지
- 하체운동
- pytorch
- 개발자
- 체스트프레스
- 오블완
- 암풀다운
- 덤벨운동
- PT 운동
- 코딩테스트
- 운동
- 개인 피티
- Today
- Total
목록디버깅 (7)
치즈의 AI 녹이기

아래 한 줄을 입력하여 해결하였다. export PATH=~/anaconda3/bin:$PATH 그럼 또 conda activate을 할 때, 이런 에러가 뜬다. 아래 한 줄로 해결하였다. source ~/anaconda3/etc/profile.d/conda.sh

커스터마이징 한 multihead attention class를 적용했을 때 다른 것들 보다도 유독 backward 속도가 느려 원인을 찾는 중이다. 원래대로라면 0.02 초 정도가 나와야 한다. 1. 모델 구조상 학습할 파라미터가 많아서 그런 것인가? 유일한 구조상 차이라고 한다면, RelativePosition이라는 클래스 두 개를 새롭게 정의한 것이다. 해당 클래스 내부의 파라미터라곤, max_length, head_dim 크기의 embedding matrix 하나. 이 또한 크기가 크지 않다고 판단했다. 2. 모든 모델 내 텐서가 같은 device에 할당되어 있는가? (cpu에 할당되어 있는 텐서가 있는가?) .get_device()로 의심이 갈만한 요소들을 체크했으나, 문제 없었다. 3. 계산이..

아래 명령어를 입력하면 모든 파일에 대한 사용자 권한을 확인할 수 있다. permission denied 오류가 발생하는 파일의 경우, 사용자 권한이 다른 파일들과 일치하지 않는다. ls -l 따라서 오류가 나는 파일의 사용자 권한을 다음과 같은 명령어로 바꿔주면 된다. sudo chown -R 참고 링크 : https://withcoding.com/103 리눅스 권한 관리 명령어 사용법 정리 (chmod, chown, chgrp 명령어) 리눅스(Linux)는 하나의 컴퓨터를 여러 사람이 사용할 수 있는 멀티유저 운영체제(OS)이기 때문에 권한 관리가 매우 중요합니다. 파일과 디렉토리의 권한을 변경하고 소유권을 변경하는 방법을 withcoding.com

watch nvidia-smi로 현재 사용중인 GPU 현황을 살펴보았더니 0번 GPU를 사용 안하고 있는데 여러 개의 Process 메모리를 차지하는 것을 확인하여 이를 제거하려고 한다. sudo kill -9 {PID} PID자리에 해당하는 숫자를 입력하면 된다. 삭제 후 모습은 다음과 같아졌다.

Git push할 때 위와 같은 오류가 난다면, git remote set-url origin https://{token}@github.com/{git_repository_url}

이 글을 참고하여 해결하였다. https://robot-vision-develop-story.tistory.com/30 Docker GPU[0000] ERROR 딥러닝 도커를 하다보면 docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]. ERRO[0000] error waiting for container: context canceled 이런 에러를 많이 접.. robot-vision-develop-story.tistory.com