본문 바로가기

분류 전체보기

(4)
[python] Pubmed 검색결과를 csv에 저장하기 Pubmed에 검색해서 나온 논문들의 제목들만 추려서 csv 파일로 출력해주는 python 코드입니다. BeatifulSoup 부분을 수정하면 snippet도 저장하도록 만들 수 있을 것 같습니다. python 코드 from bs4 import BeautifulSoup import requests import csv import urllib.parse def get_titles(url) : titleList = [] web_url = url r = requests.get(web_url) bs = BeautifulSoup(r.text,'lxml') total_result_number = bs.select("div.results-amount-container") total_result_numb..
[Python] 파이썬으로 텔레그램 봇 만들기 아래는 원하는 지역을 입력하면, 해당 지역의 온도를 알려주는 텔레그램 봇을 파이썬으로 코딩한 예시입니다. 최근 python-telegram-bot이 업데이트 되어 다른 블로그의 예제들이 작동하지 않아서 공식문서에서 제시한 예제(timerbot.py)를 적당히 바꾸었습니다. Telegram Bot 생성 BotFather를 사용하여 텔레그램 봇을 생성하고, token과 chat ID를 확인합니다. python-telegram-bot 패키지 다운로드 pip install python-telegram-bot[job-queue] 를 입력하여 python-telegram-bot 패키지를 다운로드합니다. 만약 오류가 발생한다면 pip install 'python-telegram-bot[job-queue]' 이렇게 따..
[R] R 기초 문법 변수(Variables) 변수는 데이터 값을 담는 상자입니다. =, 세 가지 대입 연산자(assignment operator)를 활용하여 변수에 값을 할당할 수 있습니다. R에서는 다른 프로그래밍 언어에는 없는 기호를 대입연산자로 쓸 수 있으며, 화살표 방향으로 값을 할당합니다. 아래 세가지 예시 중 두번째 형태를 가장 많이 사용합니다. name1 = "Kim" # 우변의 값을 좌변의 변수에 할당 name2 name3 # 좌변의 값을 우변의 변수에 할당 이제 변수에 할당한 값을 변수를 입력하여 사용할 수 있습니다. name1 # "Kim" 출력 name2 # "Lee" 출력 name3 # "Park" 출력 데이터 타입 R의 기본적인 데이터 타입은 다음과 같습니다. 숫자 - (10.5, 55, 787) 정..
Listwise deletion Listwise deletion은 통계 분석에서 결측값(missing values)을 처리하는 방법 중 하나입니다. 결측값은 데이터셋에서 일부 변수의 값이 누락되어 있는 경우를 말합니다. 이러한 결측값은 분석에 방해가 되기 때문에 처리해주어야 합니다. Listwise deletion은 결측값이 있는 레코드(행)을 분석에서 제외하는 방법입니다. 즉, 한 행에서 하나 이상의 변수 값이 누락된 경우 해당 행 전체를 데이터에서 삭제함으로써, 모든 변수에 대해 완전한 데이터만 남깁니다. 이 방법은 분석에 활용되는 데이터셋을 간단하게 만들어주기 때문에 상대적으로 간편하게 처리할 수 있습니다. 예를 들어, 만약 설문조사에서 몇 명의 응답자가 특정 질문에 답변하지 않았다면, 이러한 결측값을 처리하기 위해 listwis..