본문 바로가기

전체 글16

[혼공머신] 1주차_코랩사용법과 데이터 전처리 여름에도 진행했던 혼공학습단!!여름동안 그래도 책 한권을 꾸준히 공부할 수 있는 동기부여가 되어서 참 좋은 활동이었다고 느껴서겨울에도 신청해야지~ 하고 있다가 신청했다. 이번 겨울에 신청한 책은'혼자 공부하는 머신러닝+딥러닝' 이다.2024년 동안 머신러닝과 딥러닝을 지겹도록 배우긴 하였으나 머릿속에 뒤죽박죽 정리가 제대로 안된 것 같아 한번 제대로 정리해보면 좋겠다고 생각하여 이 책으로 결정했다.1. 나의 첫 머신러닝1-1) 인공지능과 머신러닝, 딥러닝인공지능 (Artificial intelligence)사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술- 인공일반지능(강인공지능) : 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템- 약인공지능 : 현실에서 우리가 마주하는 인공.. 2025. 1. 10.
[혼자 공부하는 R 데이터분석] 6주차_데이터 시각화(ggplot2, ggmap) 6-1. 그래프 그리기데이터 시각화를 위해 R 시각화 1순위 패키지인 ggplot2 패키지를 사용한다. (1) ggplot()ggplot(데이터세트, aes(데이터속성)그래프를 표현하는 좌표를 그리기 위한 판을 짜는 함수aes()함수를 이용해 x축과 y축에 변수를 매핑한다.패키지 설치install.packages("ggplot2")library(ggplot2) ggplot(airquality, aes(x=Day, y=Temp)) * 작성한 그래프를 지울 때는 plot.new() 함수를 실행한다. (2) 각종 그래프매핑을 위해 작성한 ggplot() 함수 뒤에 + 를 붙여 추가로 적어주면 된다.* 그래프를 그리는 수치형 데이터로 표현할 시 빈 범주가 생길 수 있으므로범주화 할 수 있는 factor() 함수.. 2024. 8. 19.
[혼자 공부하는 R 데이터분석] 5주차_데이터 가공하기(dplyr, 데이터 결합, reshape2) 5-1. dplyr 패키지* 데이터 가공 패키지* R 내장 데이터인 mtcars 이용사용법기능 및 설명예시filter(데이터, 조건문)조건에 맞는 데이터 필터링조건문 여러개 쓰려면 & 연산자 사용filter(mtcars, cyl==4)filter(mtcars, cyl>=6 & mpg>20)select(데이터, 변수명1, 변수명2..)지정한 변수(열)만 추출select(mtcars, am, gear)arrange(데이터, 변수명1, 변수명2...)arrange(데이터, 변수명1, 변수명2,                ..., desc(변수명))오름차순 정렬, 내림차순 정렬변수가 여러개 있을 경우 첫번째 변수로 정렬 후 동일 값에 대해 두번째 변수로 정렬.             arrange(mtcars, .. 2024. 8. 3.
[혼자 공부하는 R 데이터분석] 4주차_데이터 수집, 관측, 시각화 4-1. 데이터 수집하기데이터를 수집하는 방식 : 직접 vs 외부 데이터 수집가공을 거치지 않은 데이터 : 원시 데이터(=원시 자료)View(데이터프레임 변수명) 함수로 조회 (= 데이터 뷰어) 반드시 첫 글자 대문자로 작성가공하지 않은 원시 데이터만 확인 가능- 데이터 수집 방법데이터 종류사용법추가 설명직접 데이터 입력변수명  TXT 파일데이터 프레임으로 저장됨,header 기본값 False (변수명 임의지정)데이터 경로 표현시 슬래시 사용CSV 파일데이터 프레임으로 저장됨, header 기본값 TRUE-> 원시 데이터 변수명 없을 시 임의로 지정됨EXCELinstall.packages('readxl')library(readxl)데이터 프레임으로 저장됨, header 기본값 TRUE엑셀 여러 시트 중에.. 2024. 7. 29.
<서울메타위크 2024 DAY2> 3. KT의 미디어 AI 기술 및 활용 사례연사 : 윤진현 KT Customer부문 미디어플랫폼사업본부 상무 KT에서 iptv genie tv 에서 사용하고 있는 다양한 AI기술을 접목한 사례들을 대표적으로 세가지 카테고리로 나누어 설명해주셨다.1. AI : new experience - 새로운 시도들AI CURATION : 시청이력 기반 추천시청이력 : 채널 위주로 시청하는지, vod 위주로 시청하는지, 키즈랜드 위주로 시청하는지, vod 위주로 시청하는지 등개인화 추천함꼐 많이 본 영상 추천집집마다 다른 첫 화면 제공이 시간대/요일 대 등 자주보는 실시간 채널 추천보이스 부스트 (진행중) ai로 배경소리와 목소리를 분리하여 목소리를 1~3단계 스펙트럼을 조정하여 강조자막 대신에 음성을 강화해서 듣기 .. 2024. 7. 25.
[혼자 공부하는 R 데이터분석] 3주차_변수, 함수, 조건문, 반복문 3-1. 변수와 함수변수파이썬과 개념 동일R은 대문자와 소문자를 구별함. 함수를 호출할 때도 대문자와 소문자를 지켜야 한다.함수파이썬과 개념 동일return() vs cat() : 함수 출력값은 동일하나 변수에 저장가능 여부가 다름print() vs cat() : print 는 1개만 출력, cat 은 전부 출력 - 손코딩 내용# 변수 할당x  - 113페이지 문제# 4번x 3-2. 패키지함수기능install.packages(패키지명)패키지 설치library()/library(패키지명)패키지 전체 목록 확인/특정패키지 로드(1회성, 새로 킬때마다 수행해야함)remove.packages(패키지명)패키지 삭제https://cran.r-project.org/web/packages/available_packag.. 2024. 7. 18.
[혼자 공부하는 R 데이터분석] 2주차_데이터분석의 기본 알아보기 2-1. 데이터 분석 과정데이터 분석 프로세스는 다음과 같다데이터 분석 설계데이터 준비데이터 가공데이터 분석결론 도출- 주제- 가설 설정- 이후 데이터 확보 여부 확인- 분석 가능 변수 구성- 파생변수 구성- 분석 항목 결정- 직접 생성- 데이터 찾아 활용(엑셀, txt, csv, 웹 크롤링)- 데이터 형태 파악- 기술통계량, 시각화(raw data 기반)가설 검정에 도움이 되는 데이터로 가공- 불필요 변수 제거- 필요 변수만 추출- 기존 데이터간 연산 통해 조건에 맞는 데이터 구상- 새로운 변수 생성=> 데이터 세트 생성 - 기술통계량- 시각화- 분석 방법론 적용- 통계량 통해 가설 검정 및 결과 정리하여 최종 결과 도출 - 한번의 주기로 끝나는 것이 아니라 순환 구조 2-2. 데이터의 생김새유형\차원.. 2024. 7. 11.
[혼자 공부하는 R 데이터분석] 1주차_R studio 사용해보기 우연히 데이터 분석 관련 글을 찾아보다가 발견한 혼공학습단통계학 수업 대부분이 R 로 진행되기에 여름에 공부를 좀 해야겠다고 생각하던 찰나에 좋은 기회라 생각하고혼자 공부하는 R 데이터 분석 혼공을 신청했고 12기에 선정됐다! 커리큘럼은 아래와 같다. 1주차부터 차근차근 해보는걸루! 1-1. 빅데이터와 R 언어빅데이터 : 대규모 데이터데이터 과학 : 데이터를 수집하고 가공하여 데이터에서 의미를 찾는 방법R 언어 : 통계 분석을 위한 프로그래밍 언어1-2. 개발 환경 설치차근차근 나와있는 대로 R, R studio 을 설치했다.프로그래밍 언어의 경우 사용자가 직접 모든 걸 명령어로 입력하고 실행해야 하는 불편함이 있다.이 경우 통합 개발 환경을 사용하면 편리해지는데, R의 통합 개발 환경이 R GUI.R을.. 2024. 7. 3.
<datarian 5월 세미나, 생성형 AI와 함께하는 데이터 분석가 커리어> 일시 : 2024년 5월 14일 오후 3시 - 5시30분 생성형 AI와 함께하는 데이터 분석가 커리어데이터 역량 업그레이드, 데이터리안 세미나datarian.ioAI가 이젠 데이터 분석의 영역도 대체할 것만 같이 빠르게 성장중인 요즘,데이터 사이언티스트로 살아남을 수 있을까 여러 고민이 들던 와중에 이 세미나를 발견하고 수강하게 되었다.1부는 연사님이 세션을 진행하시고 2부는 패널토크로 Q&A 시간을 가졌다. 1부. 생성형 AI 시대의 데이터 사이언스연사 : 김진영 (현 네이버 서치 head of data science) 생성형 AI가 발전했지만 아직 실무에서 사용되기엔 부족함. -> 하지만 몇 년 내에 발전할 듯.LLM 이 향후 몇 년 안에 분석의 개념을 바꿀 것이다.향후 하드스킬(기술적 영역)의 비중.. 2024. 5. 14.