본문 바로가기

파이썬3

[Python] bs4 html parsing 베하 오늘은 파이썬과 bs4를 사용하여 html parsing을 하는 방법에 대해 알아보겠습니다. bs4는 다음과 같은 주요 기능을 제공합니다. HTML 및 XML 문서의 파싱 및 구문 분석 태그, 속성, 텍스트 등의 요소에 대한 액세스 CSS 선택자를 사용하여 요소 선택 데이터 추출 및 저장 bs4는 다양한 웹 스크래핑 작업에 활용할 수 있습니다. 예를 들어, 다음과 같은 작업을 수행할 수 있습니다. 뉴스 기사의 제목 및 본문 추출 상품 목록의 가격 및 재고 수량 추출 소셜 미디어의 게시물 및 댓글 추출 다음은 실제 예제 코드입니다. 저는 이마트 사이트의 과일 상품에 대한 이름과, 가격 정보를 스크랩핑 해보겠습니다. 이마트 사이트의 과일 상품들의 목록입니다. 다음은 예제 코드입니다. from bs4 i.. 2024. 1. 22.
Python Pandas 베하~! BTC_녹차공원 팀의 하동녹차 입니다. 이번주는 Python Pandas 에 대해 알아 보겠습니다. Python Pandas Pandas는 Python에서 데이터 분석과 처리를 위한 라이브러리 입니다. 주로 테이블 형태의 데이터를 처리하고 분석하는데 사용되며, 빠르고 유연한 데이터 구조를 제공하며 특히, 빅 데이터를 처리하거나 복잡한 데이터 분석 작업을 수행할 때 효과적입니다. Pandas 주요 특징 1. 데이터 구조 Pandas의 핵심 데이터 구조는 Series와 DataFrame입니다. Series: 1차원 배열과 유사한 자료구조로, 인덱스를 갖습니다. DataFrame: 2차원 테이블 형태의 자료구조로, 여러 개의 Series를 포함하며, 각 열은 다른 데이터 타입을 가질 수 있다. 2. .. 2024. 1. 2.
Python에서의 메모리 관리와 가비지 컬렉션 Python은 메모리 관리와 가비지 컬렉션에 대한 효율적인 시스템을 갖추고 있습니다. 이러한 메모리 관리 체계는 Python 프로그램의 성능과 안정성에 큰 영향을 미칩니다. 이번에는 Python의 메모리 관리 체계와 가비지 컬렉션에 대해 알아보겠습니다. Python의 메모리 할당 Python에서 객체가 생성될 때마다, 해당 객체에 대한 메모리가 동적으로 할당됩니다. Python의 내부 메모리 할당자는 이러한 객체 생성 및 삭제를 효율적으로 처리하기 위한 여러 전략을 사용합니다. 참조 카운트 Python의 주요 메모리 관리 방식 중 하나는 참조 카운팅입니다. 객체가 다른 객체에 참조될 때마다 해당 객체의 참조 카운트가 증가하고, 참조가 해제될 때마다 감소합니다. 참조 카운트가 0이 되면 해당 객체는 메모리.. 2023. 10. 27.