일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 리액트
- frontend
- TooBigToInnovate
- 차원 축소
- do it
- docker
- 대감집
- 클러스터링
- 대감집 체험기
- LDA
- ADP 실기
- Machine Learning
- 파이썬
- 빅쿼리
- Kaggle
- ADP
- 타입스크립트
- 프론트엔드
- 캐글
- Kubernetes
- 심층신경망
- 최적화
- python
- bigquery
- 쿠버네티스
- React
- DBSCAN
- 머신러닝
- r
- 구글
- Today
- Total
목록분류 전체보기 (71)
No Story, No Ecstasy
book.interpark.com/product/BookDisplay.do?_method=detail&sc.shopNo=0000400000&sc.prdNo=345300222&sc.saNo=003002001&bid1=search&bid2=product&bid3=title&bid4=001 싸니까 믿으니까 인터파크도서 book.interpark.com "그로스 해킹은 어떤 조건이 갖춰져야만 시작할 수 있는 것이 아니다." 새로운 서비스를 만들기 전에 꼭 읽어봐야 하는 책이라는 생각이 들었다. 사실 내용이 기술적으로 새롭거나, 몰랐던 필요성을 일깨워주지는 않는다. 하지만, 어떻게 그로스 해킹 시스템을 구축하는지 알 수 있게 도와주며, 실제 사례를 통해 귀찮음이라는 장애물을 걷어낼 수 있게 도와준다. 물론, 데이..
http://book.interpark.com/product/BookDisplay.do?_method=detail&sc.shopNo=0000400000&sc.prdNo=298343615&sc.saNo=003002001&bid1=search&bid2=product&bid3=title&bid4=001 싸니까 믿으니까 인터파크도서 왜 어떤 제품은 ‘대박’을 터트리고 어떤 제품은 그러지 못할까?전 세계의 기술 제품 회사 책장에 한 권씩 있는 스테디셀러, [인스파이어드]마티 케이건이 새롭게 집필한 개정판으로 다시 만난 book.interpark.com "우리가 원하는 것은 용병팀이 아닌 미션팀이다." 나만의 브랜드를 만들겠다는 결심을 한 후 가장 먼저 읽었던 책이다. 스타트업 PM들에게는 입문서로 여겨지는 책이라..
Python과 가상 환경 Python에서는 사소한 모듈들의 버전 차이로 인해 에러가 발생하는 경우가 있다. 때문에 패키지들 간 버전 호환성을 유지하는 것이 중요하다. 하지만 매 프로젝트마다 패키지들의 버전을 조정하는 것은 매우 비효율적인 일이다. 따라서, 가상 환경을 통해 각 프로젝트에 맞는 버전과 모듈을 활용한다. 관련 tool에는 pyenv, pyenv-virtualenv, poetry, anaconda 등이 있다. MongoDB - 장점: RDB와 개념이 유사하여 사용법이 비슷하다(쿼리 변환기도 있음). RDB 대비 Read & Write 성능이 월등하다. 스키마 관리가 필요 없다. 샤드(Shared Disk) 추가가 간편하다(rebalancing은 불가능). Index 기능을 제공한다. - 단점:..
D3.js D3.js: Data-Driven Documents. JavaScript 자바스크립트 기반의 라이브러리 언어로, 사용자가 정의한 시각화 규칙을 바탕으로 데이터를 웹에 시각화해준다. HTML5의 SVG (Scalable Vector Graphic)을 활용하여 다양한 크기의 화면에서 깨짐 없이 시각화할 수 있다. Loading, Selecting/Binding, Transform, Transition 동작으로 이루어진다. SVG 웹 용 벡터 그래픽으로, 인터넷 익스플로러 8 이하를 제외한 모든 브라우저에서 HTML 문서에 직접 포함/삽입할 수 있다. D3 메서드는 입력으로 출력의 참조를 활용한다. 메서드 체인을 구성하여, 코드 한 줄에 여러 동작을 실행하도록 개발한다. Grouping Elemen..
Google BigQuery의 특징 클라우드 환경의 Data Warehouse로, PB 급의 데이터 저장 및 분석용 서비스다. 관계형 구조를 가지지 않는 NoSQL 기반의 데이터 저장소이지만, RDBMS처럼 사용할 수 있는 SQL를 제공한다. - Serverless: 별도의 운영 환경 세팅이 필요 없다. - SQL 활용: 일반 SQL을 통해 데이터 조회가 가능하다. (레코드 형식의 필드인 경우 unnest 함수를 통해 flatten 작업 필요) - 3중 복제: 3중 복제로 인하여 데이터 안정성 보장 (하둡과 동일) - REST API를 활용한 배치, 스트리밍 기능을 모두 지원 Google BigQuery의 데이터 구조 - Project: 최상위 컨테이너. 다수의 Data Set 소유 가능. 사용자와 Da..
어절, 혹은 문장을 최소 의미 단위인 형태소로 분절하는 것을 뜻한다. 대표적으로는 python의 KoNLPy library가 있으며, Hannanum, Kkma, Komoran, Okt 품사 태깅 옵션을 제공한다. BERT 사전 훈련 언어 모델을 뜻한다. 각 언어는 서로 비슷한 뜻을 가질 수도, 상반된 뜻을 가질 수도 있다. 단어의 의미를 벡터로 표현(Embedding)하여, 단어 간 유사성을 (비슷한 벡터 값을 가짐으로써) 나타내는 것이 목적이다. BERT는 사전 훈련 Embedding을 통해 단어 간 유사성을 잘 나타내도록 만들어진 모델이다. 한글은 SKT의 KoBERT가 좋은 성능을 보인다고 알려져 있다. 디리클레(Dirichlet) 분포 베타 분포는 사건이 발생한 횟수가 번, 발생하지 않은 횟수가..
1. One-hot Encoding Categorical data의 각 값을 하나의 bit로 나타내는 방법이다. 각 비트가 하나의 feature가 되며, k개의 범주를 가진 categorical data는 길이 k를 갖는 피처 벡터로 표현된다. 이 방법은 선형 종속성을 가진다(k개 feature의 합이 1). 2. Dummy Coding, Effect Coding Dummy Coding은 k-1개의 feature로 k개 범주의 categorical data를 표현한다(선형 종속성 제거). 하나의 피처가 책임을 지고 모든 요소가 0인 벡터로 표현된다. Effect Coding은 Dummy Coding과 매우 비슷하지만, (모든 feature 값이 0인) 기준 범주가 모두 -1의 벡터로 표현된다. 선형 회귀..
book.interpark.com/product/BookDisplay.do?_method=detail&sc.prdNo=318625963 싸니까 믿으니까 인터파크도서 1장. 누구나 UX 전문가가 될 수 있다 2장. 두 가지 이상의 서체를 사용하지 마라 3장. 사용자의 컴퓨터에 설치된 폰트를 사용하라 4장. 글자 크기를 사용해서 정보 체계를 표현하라 5장. 본문에는 book.interpark.com 1. 누구나 UX 전문가가 될 수 있다 2. 두 가지 이상의 서체를 사용하지 마라 3. 사용자의 컴퓨터에 설치된 폰트를 사용하라 4. 글자 크기를 사용해서 정보 체계를 표현하라 5. 본문에는 합리적인 기본 크기를 사용하라 6. 줄임표를 사용해서 다음 단계가 있다는 것을 알려라 7. 버튼을 버튼처럼 보이게 만들어라..