본문 바로가기

tensor2

[pytorch] tensor를 이해해보자! tensor라 함은 3차원 이상의 데이터를 이야기합니다. 0차원은 scaler, 1차원은 vector, 2차원은 matrix (행렬) 이라고 하죠. 우리가 딥러닝을 배우면서 많이 다루게될 데이터는 2차원 이상의 데이터입니다. 그렇다면 2차원 이상의 데이터를 어떻게 생각해야할까요?! 아래 그림을 보면서 설명하도록 하겠습니다. 위 사람사진에 대해서 얻을수 있는 데이터를 상상해 봅시다. 유전자에 대해서 알수가 있을 것 같고, 뼈사진을 통해 건강한 뼈를 가진 사람인지도 알 수가 있을것같구요. 그리고 키도 알 수가 있겠죠. (정확한 수치는 사진에 나오지 않았지만 알수있다고 가정해봅시다.) 한 사람에서 나오는 데이터의 양을 유전자, 뼈상태, 키 이렇게 대략 알 수가 있을 것입니다. 여기서 유전자, 뼈상태, 키 각각.. 2021. 8. 5.
[pytorch] tensor 나누는 방법들 (split, chunks, 데이터 나누기) tensor는 데이터를 이야기합니다. 2차원을 2 Tensor 3차원을 3 Tensor라고 이야기 하죠. 딥러닝을 돌리다 보면 이러한 tensor를 나눠서 돌려야할 때가 있습니다. batch size를 조절하거나 혹은 test set, validation set, train set을 나눌때도 이러한 데이터를 나눠야 합니다. 그럴때 사용할수 있는 간단한 방법을 설명하고자 합니다. split, chunks는 자세히 설명하지 않으면 조금 헷갈릴수가 있는 기능입니다. split의 경우 데이터당 최대 자료가 n개를 가지게 하는 방법이고, chunks의 경우 데이터를 n개로 나누는 거죠. chunk와 split의 위의 설명으로는 헷갈릴수가 있으니 예시를 보여주도록 하겠습니다. 같은 17줄을 split와 chunk로.. 2021. 8. 3.