본문 바로가기

딥러닝\머신러닝/에러 디버깅7

[Torch] RuntimeError DataLoader worker pids 15332 exited unexpectedly 에러가 나는 이유? 1. Introduction 딥러닝을 하다보면 다음과같은 에러가 발생할 때가 있다. RuntimeError : DataLoader worker pids * exited unexpectedly 구글에 찾아보면 dataloader에 num_workers = 0 으로 수정하면 된다는 포스팅이 보인다. 혹은 에러나는 부분의 구문을 삭제하라는등.. 이런 해결책이 보인다. dataloader에서 사용하고 있는 num_workers는 병렬로 처리해서 분석해주는 것이기 때문에 데이터가 클 때 빠르게 분석하고 싶다면 필수적으로 사용해야한다. 대신 무턱대로 숫자를 올리면 서버가 너무 느려지니 고려해야한다. 2. 이유가 뭔데? 에러의 이유는 다양하다. - 이것저것 많이 돌려서 메모리가 충분하지 않거나 - 데이터의 문제가 있.. 2023. 9. 26.
[Pytorch] torch.hub.load를 사용 못하는 상황에서 로컬로 진행하기 일하는 곳이 병원이다 보니 시발 폐쇄망에서 서버를 돌리고 있습니다. 이게 단점이 외부에 접속해서 뭔가 다운이 안되는 단점이 있습니다. 우회로 로컬컴에서 다운받고 서버로 옮기는 것은 가능합니다. 이번에 SwinTransformer모델을 돌리게 되었는데, 제가 받은 코드에는 github에서 모델을 다운받아야 하는 코드였습니다. -> torch.hub.load 말입죠. 당연히 폐쇄망이기 때문에 다운이 안되어서 이런저런 방안을 찾다가 해결책을 찾아 포스팅합니다. 코드에서는 다음과 같이 사용하더군요. torch.hub.load('github의 모델','모델명',pretrained) 일단 SwinTransformer에서 모델을 사용하기 위해서 로컬컴퓨터에서 해당 github를 방문해줍니다. https://githu.. 2023. 4. 28.
RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 16 but got size 15 for tensor number 1 in the list. 에러 해결 Unet 모델을 제작해서 돌리는데, 아래와 같은 에러가 나왔습니다. 정말 여기저기 찾아봤는데,, 해결이 안되었는데, 코드를 이것저것 돌려보니 해결이 되었네요.. RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 16 but got size 15 for tensor number 1 in the list. 위와 같은 에러가 발생할 경우 모델을 제작할때, 256으로 제작했을때, 실제 input으로도 같은 사이즈를 넣어줘야 합니다. 아니면 위와 같은 에러가 발생할수 있습니다. 그렇기 때문에 transforms function을 이용해서 그림의 크기를 조절하는 Resize를 이용하여 분석하면 됩니다. # inputs의 경우.. 2022. 11. 9.
[pandas, DataFrame] ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 에러해결 최근 급하게 pandas를 써야되서 기초부터 배우기 보다는 중간중간 찾으면서 일을 진행중에 있는데, 다음과 같은 에러가 떳습니다. # 다음과 같이 진행하였을때, Filter_mat_1= Filter_mat['img_name'][Filter_mat['variance1']==1&Filter_mat['variance2']!=1] # 아래와 같은 에러가 뜹니다. ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all(). 이 오류를 구글링을 해보니까. "and", "or" 대신에 "&", "|" 이걸 사용하면된다. 라는 답변을 보았는데, 이미 그걸 쓰고 있는데..... 무슨이유일까 .. 2022. 9. 8.
[pytorch] device-side assert triggered error 해결방법 1. 에러 발생 상황 torchvision.model 에서 resnet 50을 불러와서 fully connected 부분을 변경시킨 모델을 응용하여 새로운 모델을 작성중에 에러가 발생되었습니다. 에러 내용은 다음과 같습니다. RuntimeError: CUDA error: device-side assert triggered 또는 RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling `cublasCreate(handle)` 첫번째 에러의 경우 colab에서 확인된 에러이고, 두번째의 경우 로컬 컴퓨터에서의 에러입니다. RuntimeError: CUDA error: device-side assert triggered CUDA kernel erro.. 2022. 6. 13.
[tensorflow 설정] get_config error 해결 에러발생시 ImportError: cannot import name 'get_config' from 'tensorflow.python.eager.context' (c:\users\user\appdata\local\programs\python\python38\lib\site-packages\tensorflow\python\eager\context.py) 위 에러의 경우 keras가 버전이 높아지면서 tensorflow와 합쳐져서 생기는 에러임.. 그렇기 때문에 keras를 낮춰주면됨. 혹은 tensorflow로 keras를 import 시키던지 해결방법은 다음과 같음. (아마 위에 있는 방법이 원하던 해결 방법일듯 함) pip install keras==2.3.1 or from tensorflow impo.. 2022. 3. 10.