텐서플로우에서 이미지 데이타 처리 성능 향상방법

빅데이타 & 머신러닝/머신러닝

텐서플로우에서 이미지 데이타 처리 성능 향상방법

Terry Cho 2017. 2. 25. 23:39

이미지 인식 모델을 만들다가 파일 포맷 성능 향상 관련해서 좋은 팁을 찾아서 메모

if you are working with >O(1000) JPEG images, keep in mind that it is extremely inefficient to individually ready 1000's of small files. This will slow down your training quite a bit.
A more robust and faster solution to convert a dataset of images to a sharded TFRecord of Example protos. Here is a fully worked script for converting the ImageNet data set to such a format. And here is a set of instructions for running a generic version of this preprocessing script on an arbitrary directory containing JPEG images.
http://stackoverflow.com/questions/37126108/how-to-read-data-into-tensorflow-batches-from-example-queue

1000개 이상의 JPEG나 PNG 이미지를 매번 읽어서 트레이닝을 시킬 경우, 트레이닝 성능이 낮아진다.

그래서 JPEG 포맷을 사용하지 말고 TFRecord 포맷을 사용하고, TFRecord 포맷에서 한 파일에 하나의 데이타를 넣지말고 여러 데이타를 넣는 방법을 사용해야 한다.

저작자표시 비영리

'빅데이타 & 머신러닝 > 머신러닝' 카테고리의 다른 글

텐서플로우 - 파일에서 학습데이타를 읽어보자#2 (Reader와 Decoder) (3)	2017.03.11
텐서플로우-파일에서 학습 데이타를 읽어보자 #1 (큐 사용 방법과 구조) (4)	2017.03.07
머신러닝 이미지 데이타 뻥튀기 방법 (0)	2017.02.25
텐서 보드를 이용하여 학습 과정을 시각화 해보자 (0)	2017.01.31
딥러닝을 이용한 숫자 이미지 인식 #2/2-예측 (12)	2017.01.09

현재글텐서플로우에서 이미지 데이타 처리 성능 향상방법

실리콘밸리에서 살고 있는 평범한 엔지니어 입니다 이메일-bwcho75골뱅이지메일 닷컴. 아키텍처 디자인, 머신러닝 시스템, 빅데이터 설계, DEVOPS/SRE, 애자일 방법론,쿠버네티스,마이크로서비스, ChatGPT 생성형 AI , CTO 등에 대한 기술 멘토링과 강의 진행합니다. 쓰레드 : https://www.threads.net/@byungwookcho

텐서플로우, 강좌, tensorflow, Tutorial, google, 머신러닝, 빅데이타, 소개, cloud, 쿠버네티스, Machine Learning, node.js, 구글, 딥러닝, 조대협, 클라우드 컴퓨팅, 튜토리얼, 클라우드, Kubernetes, 초보,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

조대협의 블로그