목록분류 전체보기 (89)
questionet
1. 파이썬 이란¶ 간단하고 배우기 쉬운 프로그래밍 언어입니다. 오픈소스라 무료로 자유롭게 이용할 수 있습니다. 영어와 유사한 문법으로 불편한 컴파일 과정도 없어서 편리합니다. 파이썬 코드는 읽기 쉽고 성능도 뛰어납니다. 파이썬은 과학분야, 특히 기계학습과 데이터 과학 분야에 널리 쓰입니다. 파이썬 자체의 뛰어난 성능에 numpy와 SciPy 같은 수치 계산과 통계 처리를 다루는 탁월한 라이브러리가 더해져 데이터 과학 분야에서 확고한 위치를 차지하고 있습니다. 딥러닝 프레임워크에서도 파이썬을 애용합니다: Caffe, TensorFlow, Chainer, Theano ★ 파이썬은 데이터 과학 분야에 아주 적합한 프로그래밍 언어입니다.¶ In [22]: # 파이썬 버전 확인하기 !python --versio..
어떤 샘플 X들의 집합이 있을 때 X_new = (X - mean) / Std 각 샘플에서 샘플들의 평균을 빼주고 표준편차로 나눠주는 것 = z1 score 정규화 (표준화) X_new = (X - X_min) /( X_max - X_min) 각 샘플에서 최소값을 빼주고 최대값과 최소값의 차이로 나눠주는 것 = min-max scaling or 정규화 X_new = X / ||X| 각 샘플들을 L2 norm으로 나눠주는 것 = L2 norm 정규화 공통점 값이 원래보다 작아진다 표준화의 특징 0 데이터들을 zero-centered 시킨다. (데이터들의 평균이 0, 분산이 1이 되도록한다) 1 데이터들을 특정 값의 범위 내에 분포하게 만들지 않는다. 2 아웃라이어에 영향을 덜 받는다. 3 데이터들이 정규분..
Open domain 챗봇을 만드는 게 얼마나 어려운 일인지 배워가고 있다. 단순한 QA챗봇 구조로는 일상대화가 가능한 챗봇을 구현하기가 매우 힘들고 비효율적이었다. 그러나 이전 대화내용을 기억하는 챗봇, 복수의 도메인에 맞춤화된 답변을 내놓는 챗봇, 대화를 주도해 나가는 챗봇을 구현할 수 있는 구조는 현실적으로 해커톤 기간 내에 이해와 구현이 불가능해 보였다. 그렇다면 가장 주안점을 두어 볼 만한 기능은 챗봇이 일관된 답변을 내놓게 하는 것이었다. 그렇게 하자면 여기저기서 구한 말뭉치들의 레이블을 전부 손봐야 하는 번거로움이 생겼다. 현재 수집하여 분석한 말뭉치는 다음과 같다. 1. 국립국어원이 제공한 구어 말뭉치(신문방송뉴스 상의 대화, 드라마 대본)와 일상대화 말뭉치(위와 같은 공적 대화), 2. ..
바닥부터 배우는 강화 학습 Chapter 5 이번 챕터에서는 모델 프리상황에서의 prediction을 하는 2가지 방법에 대해 배운다. = MDP를 모르는 상황에서 임의의 정책이 주어졌을 때 각 상태의 가치를 평가하는 2가지 방법에 대해 배운다. 1. 몬테카를로 학습 2. TD (Temporal Difference) 학습 용어 정리 MDP (Markov Decision Process) 를 모른다는 것의 의미 1. 보상함수(R)를 모른다 = 어떤 상태 s에 도착하게 됐을 때 받게 되는 보상이 뭔지 모른다 2. 전이확률행렬(P)을 모른다 = 현재 상태 s에서 어떤 액션a를 했을 때 가게 될 다음 상태들의 확률분포를 모른다 >>> 둘 다 액션을 해봐야 안다 = MDP를 모르는 상태 = 모델 프리 (모델을 모르..
A/S기사 - 전화상담원 - 판매부서 소비자가 제품을 구매하고 사용했을 때 직접적으로 연락이 가능한 데는 저 세 곳이다. 주로 상담원을 통해 기사나 판매담당자와 연락이 되고 그 윗선은 상담원 또는 인터넷 홈페이지나 직통번호로 연결될 수 있다. 대개 윗선에 있는 사람들은 일단 말을 잘한다. 기업규모가 클수록 합리적으로 말하는 편이며 그만큼 시시비비와 책임소재를 최대한 명확히 가려주려고 한다. (소비자가 그런 대답을 얻어낼 수 있을 만큼 부당한 상황을 겪었고 그 이유를 아주 잘 소명해낸다는 전제 하에) 윗선까지 연락이 닿을 수 있는 경우는 별로 없다. 상담원 선에서 막히거나(규모가 작은 회사이거나 임직원 자체가 글러먹은 경우) 상담원이 전달해도 윗선 자체에서 씹는 게 다반사다. 결국 소비자는 상담원과 A/S..
까뮈의 시지프 신화 중 내가 가장 좋아하는 부분은 부조리한 창조에 나오는 다음 구절들이다. "부정적인 사고만큼 예술에 이바지하는 것은 없다. 마치 백색을 이해하자면 흑색이 필요하듯이... '부질없이' 작업하고 창조하는 것, 진흙으로 조각품을 만드는 것, 자신의 창조에 미래가 없음을 아는 것, 자신이 만든 작품이 하루 사이에 부서져버리는 것을 보면서 그것이 근본적으로는 수세기에 걸친 장구한 미래를 위하여 건축하는 것처럼 아무 중요성도 없다는 것을 의식하는 것... 나날의 노력, 자기 억제, 진리의 한계들에 대한 정확한 판단, 절도와 힘... 이 모든 것이 '쓸데없는 것을 위해서'이고 끝없이 되풀이하고 제자리걸음 하기 위해서인 것이다. 그러나 아마도 위대한 작품은 그 자체가 중요하다기보다 오히려 그것이 인간..

참고 1 d2.naver.com/helloworld/0315536 2 파이썬 알고리즘 인터뷰 3 알고리즘 라이프 4 hackernoon.com/timsort-the-fastest-sorting-algorithm-youve-never-heard-of-36b28417f399 5 docs.python.org 파이썬의 정렬 메서드는 크게 두 가지다. 1) 리스트 객체에서만 쓸 수 있는 sort() 2) 모든 이터러블 객체에 쓸 수 있는 sorted() sort()의 특징 1. 리스트에서만 쓸 수 있다. 2. 리스트는 mutable 한 객체이므로 sort() 메서드를 사용하면, 기존 리스트는 정렬된 리스트로 대체된다. # 기본은 오름차순 정렬 data = [2, 3, 5, 54, 123, 2, 3, 1, 2, 4..