분류 전체보기 92

12월 17일 TIL

데이터 분석 복습 5주차 6~9 & 숙제 1) 자체 숙제 (문제점 발견) 만들어 보기 created_atuser_idnameprogress_rate2022. 8. 15237a15a4c854a19f이시우1002022. 8. 89e39ebcdb3e41fdb경서희1002022. 8. 8ccd9564adf22a5f7지소희362022. 8. 1291ad78f3adfa9ee최가은100 자료 일부분임  필요 정보 - created_at , progress_rate , user_id created_at 날짜별로 나누기 위해progress_rate 날짜별 진도율을 알기 위해user_id 각 개체별로 카운트하여 총 합을 알아내기 위해 예상 작업 순서1. 공란 확인 후 있을 시 제거2. created_at 데이터 형식 확인..

본 캠프 TIL 2024.12.17

12월 16일 TIL

데이터 분석 4주차 복습 완강&숙제  1) 차트 한글 변환 필수 코드(코드 따로)!sudo apt-get install -y fonts-nanum!sudo fc-cache -fv!rm ~/.cache/matplotlib -rf 1-1) 본 코드에 입력plt.rc('font', family='NanumBarunGothic')   2) 공란 셀 삭제, 그룹바이 코드sparta_data=sparta_data.dropna()access_media=sparta_data.groupby('access_media')['user_id'].count()   3) 그래프 바 색상 변경 방법- x축,y축 기재 후 ,color='원하는 색상' 을 추가로 기재한다plt.bar(access_media.index ,access_me..

본 캠프 TIL 2024.12.16

12월13일 TIL (사전 캠프 완)

2회차 데이터 분석 2주차 7, 3주차 1~6 코드 복습용어설프게 타이핑하며 외우지 말고 일단 눈으로 익히고 대강 감을 잡아보자!sudo apt-get install -y fonts-nanum!sudo fc-cache -fv!rm ~/.cache/matplotlib -rf  x=6y=8hello="world"print(x)print(hello)x+yhelloimport pandas as pdimport matplotlib.pyplot as plttitanic = pd.read_table('train.csv',sep=',')# 1.Null(공백) 데이터 파악하기print(titanic.isnull().sum())# 2. 공백 데이터 제거하기titanic = titanic.dropna()#상관계수 구하기co..

사전 캠프 TIL 2024.12.13

12월12일 TIL

데이터 분석 5주차 -7,8 & 숙제 1) 피벗 테이블 만들기 피벗 테이블 :기존의 데이터를 바탕으로 필드를 재구성해,데이터 통계를 보다 쉽게 파악 할수 있도록 만든 테이블 cohort_counts = cohort_data.pivot(index="start_week",columns="week",values="user_id")cohort_counts 해석:cohort_counts 만들거야.어떤?cohort_data에서 pivot피벗 테이블을.어떻게?index="start_week", 행은 start_weekcolumns="week", 열은 weekvalues="user_id" 내용은 user_id로만들어진 cohort_counts 보여줘 결과.  2) 리텐션 테이블 만들기  리텐션 : 고객이 우리 제품이나..

사전 캠프 TIL 2024.12.12

12월 11일 TIL

데이터분석 5주차- 1~7  1. 나이대별 수강률 합 구하기 progress_rate_by_age = sparta_data.groupby('age')['progress_rate'].sum()progress_rate_by_age 해석 : progress_rate_by_age를 만들 것 이다. sparta_data를 groupby한 것이 필요한데, ('age')별로 ['progress_rate']를 sum()합친것이 필요하다.그럼 이제 progress_rate_by_age 값 띄워봐 결과.  2. 나이대별 수강생의 인원 구하기 number_people_by_age = sparta_data.groupby('age')['_id'].count()number_people_by_age 해석 : number_peopl..

사전 캠프 TIL 2024.12.11

12월10일 TIL

***** 참고그래프 한글 깨질 때 1) 새 코드에 코드 기입 후 ctrl enter!sudo apt-get install -y fonts-nanum!sudo fc-cache -fv!rm ~/.cache/matplotlib -rf 2) 런타임 -> 세션 다시 시작 3) 진행중인 코드에 기입 후 ctrl enterimport matplotlib.pyplot as plt plt.rc('font', family='NanumBarunGothic')    데이터분석 3주차-숙제 목표 : 수강생의 즉문즉답의 수요가 많은 요일을 알아내서 튜터님의 수를 요일에 따라 적절히 배치 가설: 수강생들의 수업 완료 시간대는 주로 한가한 주말일 것이다 ⇒ 즉문 즉답을 하기 위해선, 수강 완료가 되어야 합니다! 그러니, 요일별 수..

카테고리 없음 2024.12.10

12월9일 TIL

05. [ 미션 2] 제품 수요가 많은 지역을 찾아라 ! _ 라인 그래프 그리기 목표 : 가장 수강을 많이 하는 지역을 데이터분석으로 찾기 수업을 신청한 수강생 수를 지역별로 나누는 전처리가 필요 1) Pandas 및 파일 불러오기 import pandas as pdsparta_data = pd.read_table(' 파일경로 ',sep=',')  2) 데이터 살펴 보기 sparta_data.head()user_id ( 유저 id)area: 접속 지역latitude: 해당 지역 위도longitude: 해당 지역 경도  3) 지역 분류 하기 category_range = set(sparta_data['area'])print(category_range, len(category_range)) 왜set() 을 ..

사전 캠프 TIL 2024.12.09

12월6일 TIL

3주차-3 (명령어 오류 있음) 미션 : 가장 적절한 고객 관리 타이밍은? sparta_data=pd.read_table('/content/access_detail.csv',sep=',') 필요한 데이터 확인하기  1) sparta_data.head() 로 확인 (access_date, user_id 만 필요함)  lecture_id access_date user_id 8123 5f36558829f38171335a890a 2020-09-03 22:37:33 6da398d852411234 8124 5f36558829f38171335a890a 2020-08-29 11:09:58 6da398d852411235 8125 5f36558829f38171335a890a 2020-09-06 12:25:25 6da398..

사전 캠프 TIL 2024.12.06

12월 5일 TIL

문제 정의 및 가설 설정 -> 데이터 분석 기본 세팅 -> 데이터 분석 -> 분석 결과 시각화 하기 -> 최종 결론 판다스 (2주차-4) 상관관계 분석을 위한 판다스 1)판다스 사용 선언   1-1) import pandas as pd + Ctrl / Enter => 판다스 사용 하겠다 명령어 2)데이터 가져오기  2-1) 파일 가져오기  2-2) titanic = pd.read_table('train.csv',sep=',') 타이타닉으로 명며한 트레인 파일 읽겠다 명령어   * titanic=pd.read_table('파일이름.xlsx',engine='openpyx') 타이타닉으로 명명한 트레인 엑셀 파일 읽겠다 명령어 3)데이터 확인 및 표 읽기  3-1) titanic.head() 타이타닉으로 명명..

사전 캠프 TIL 2024.12.05

12월4일 TIL

■ 팀퀘스트 🤝팀원과 함께 몸을 풀어볼까요? 진행  퀘스트 주제 : Q. 실제로 QAQC 직무는 현업에서 어떤일을 하고, 어떤 데이터를 볼까? 아직 잘 모르겠다면, 내가 아는 케이스가 많지 않다면 오늘의 직무인터뷰가 많은 도움이 될거에요! 가고싶은 도메인을 확정짓지 못했더라면 여러 케이스를 보고 나에게 가장 잘 맞는 도메인을 정해보는 좋은 밑거름을 마련해봅시다. 도메인 : https://www.jobkorea.co.kr/starter/interview/View/22435?utm_source=chatgpt.com    배운점 & 느낀점팀원들이 사회 경험이 없어 인터뷰 위주의 아티클을 선정해 아쉬웠지만 굳이 신경쓰지 말고 알던 내용이 나오면 복습하고 모르는 내용이 나오면 배우면 된다 생각GMP(Good M..

사전 캠프 TIL 2024.12.04

12월 3일 TIL

■ 팀퀘스트 🤝팀원과 함께 몸을 풀어볼까요? 진행  퀘스트 주제 : Q. 실제로 QAQC 직무는 현업에서 어떤일을 하고, 어떤 데이터를 볼까? 아직 잘 모르겠다면, 내가 아는 케이스가 많지 않다면 오늘의 직무인터뷰가 많은 도움이 될거에요! 가고싶은 도메인을 확정짓지 못했더라면 여러 케이스를 보고 나에게 가장 잘 맞는 도메인을 정해보는 좋은 밑거름을 마련해봅시다.    배운점 & 느낀점    1.  개인별로 자료 요약하는 방법이 달라 새로운 정보를 깨달음 (*5why 기법)    2.  압력용기 제조업체 QC경험이 있다보니 해당 퀘스트 이해하기가 원활함* 5why 기법 : 문제의 근본 원인을 찾기 위해 '왜(Why)'를 다섯 번 반복해서 질문하는 문제 해결 기법  ■ 데이터 분석 종합반 1주차 1-1 ~..

사전 캠프 TIL 2024.12.03

QA / QC 란?

QA (Qulity Assurance) 품질 보증QC (Qulity Control) 품질 관리 도대체 무슨 차이지? QA(품질 보증), QC(품질 관리)의 차이점을 설명하기 위해 경험에 깃댄 예시를 참고해보자. 필자는 압력용기 제작업체 QC(품질 관리)로 근무하였다.   압력용기 제작업체를 예로 들어보자면 압력용기의 공정은 아래의 순서로 이루어진다. 압력용기 공정 순서 1. 원청업체로 부터의 제작 의뢰  2. 요구한 스펙(조건)에 맞춰 압력용기 설계  3. 원자재 구매 4. 원자재 가공 및 성형 5. 용접  6. 후처리 7. 납품  1.~7.에서 QC(품질관리)의 업무는 하단의 1)~7)를 의미한다. 각 검사는 해당 스펙(ASME, PED 등)을 기반한다. 1) 설계검사 2) 원자재 성분 함량, 밀시트 ..

사전 캠프 TIL 2024.12.02