profile
AI 공부합니다

[Robotics] 6. Robot CV Connection 정리

이 문서는 ROS2, 로봇 모델링, MoveIt, 컴퓨터비전이 하나의 로봇 작업 파이프라인으로 연결되는 과정을 정리한다. CV는 이미지에서 물체, 영역, 특징을 찾지만, 로봇이 행동하려면 그 결과가 depth, camera intrinsic, hand-eye calib

6일 전
·
0개의 댓글
·

[Robotics] 5. CNN & Object Detection 이론 정리

이 문서는 컴퓨터비전이 사람이 설계한 feature에서 데이터로 학습한 feature로 확장되는 흐름을 정리한다. CNN은 convolution filter를 학습해 이미지의 지역 패턴을 추출하고, augmentation은 제한된 데이터에서 다양한 조건을 경험하게 해

6일 전
·
0개의 댓글
·
post-thumbnail

[Robotics] 4. 고전 CV & Image Processing 이론 정리

이 문서는 딥러닝 이전의 컴퓨터비전 기초를 이미지의 수치적 표현과 규칙 기반 처리 관점에서 정리한다. 이미지는 픽셀 배열이며, grayscale/RGB, histogram, contrast, noise, edge, region 같은 신호 특성을 이해해야 이후 detec

6일 전
·
0개의 댓글
·

[Robotics] 3. Isaac Sim 이론 정리

이 문서는 Isaac Sim을 로봇, 센서, 물리, 작업 시나리오를 가상 환경에서 검증하는 시뮬레이션 도구로 정리한다. Isaac Sim은 Omniverse와 USD 기반으로 로봇 모델, gripper, 물체, 물리 속성, camera/LiDAR/IMU/contact

6일 전
·
0개의 댓글
·

[Robotics] 2. Robot Motion Tool 정리

0. 전체 내용 요약과 키워드 이 문서는 로봇의 구조를 정의하고, 그 구조를 실제 움직임으로 연결하는 과정을 정리한다. URDF/Xacro는 link, joint, visual, collision, inertial 정보를 통해 로봇의 몸과 운동학적 tree를 만든다. RViz는 이 모델과 TF, joint state, planning 결과를 시각화하고, ...

6일 전
·
0개의 댓글
·

[Robotics] 1. ROS2 개념 정리

0. 전체 내용 요약과 키워드 이 문서는 ROS2를 로봇 시스템을 구성하는 분산 미들웨어로 정리한다. 핵심은 로봇 기능을 하나의 큰 프로그램이 아니라 여러 node로 나누고, node 사이를 topic, service, action으로 연결하는 방식이다. Topic은 지속적으로 흐르는 데이터, service는 요청과 응답, action은 시간이 걸리는 목...

6일 전
·
0개의 댓글
·

[Project] MacGyvBot 로봇틱스 프로젝트 정리

MacGyvBot: 음성/GUI 기반 공구 전달 및 반납 로봇 어시스턴트MacGyvBot은 작업자가 공구 보관 장소까지 직접 이동하지 않아도, 로봇팔이 필요한 공구를 찾아 전달하고 사용 후 다시 서랍에 정리하는 ROS 2 기반 로봇 어시스턴트 프로젝트이다. 사용자는 음

6일 전
·
0개의 댓글
·

[Business] 비즈니스 커뮤니케이션 이론 정리

비즈니스 커뮤니케이션을 공부하면서 가장 크게 느낀 점은, 커뮤니케이션이 단순히 말을 잘하는 기술이 아니라는 것이다. 말투, 태도, 표정, 복장, 전화 응대, 이메일 작성, 문자 한 줄까지 모두 상대에게 나를 보여주는 방식이다.결국 비즈니스 커뮤니케이션의 핵심은 상대와

2026년 6월 19일
·
0개의 댓글
·

[Business] Operation Management 이론 정리

생산운영관리(Operation Management, OM)를 한 학기 동안 공부하면서 가장 크게 느낀 것은, OM이 단순히 공장이나 생산라인을 관리하는 과목이 아니라는 점이다. 운영관리는 기업이 가진 사람, 자본, 설비, 원자재, 정보, 기술을 활용해 고객이 원하는 제

2026년 6월 19일
·
0개의 댓글
·

[Business] 마케팅 이론 정리

마케팅을 한 학기 동안 공부하면서 가장 크게 느낀 것은, 마케팅이 단순히 “물건을 잘 파는 방법”이 아니라는 점이다. 마케팅은 제품 자체를 설명하는 일이 아니라, 소비자가 그 제품을 어떻게 인식하게 만들 것인가를 설계하는 일에 가깝다. 즉, 제품의 기능, 가격, 디자인

2026년 6월 19일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] THE LOTTERY TICKET HYPOTHESIS: FINDING SPARSE, TRAINABLE NEURAL NETWORKS

기본 정보: ICLR 2019에서 발표된 Jonathan Frankle과 Michael Carbin(MIT CSAIL)의 논문 "The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks"입니다.목

2026년 5월 26일
·
0개의 댓글
·

[Insight] 네트워크관리사 2급 필기 정리

FTP는 응용 계층 프로토콜이다.HTTP는 응용 계층 프로토콜이다.HTTPS는 TLS를 통해 애플리케이션 계층 데이터를 암호화한다.SNMP는 응용 계층 프로토콜이다.IPsec은 OSI 3계층에서 동작한다.L7 스위치는 응용 계층에서 동작한다.메시지를 짧은 패킷으로 분할

2026년 5월 17일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] NATURE-INSPIRED POPULATION-BASED EVOLUTION OF LARGE LANGUAGE MODELS

기본 정보: 본 논문은 "NATURE-INSPIRED POPULATION-BASED EVOLUTION OF LARGE LANGUAGE MODELS"라는 제목으로 Yiqun Zhang 등(Northeastern University, Shanghai AI Lab)이 202

2026년 5월 9일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] SPATIAL FORCING: IMPLICIT SPATIAL REPRESENTATION ALIGNMENT FOR VISION-LANGUAGE-ACTION MODEL

기본 정보: 본 논문은 "Spatial Forcing: Implicit Spatial Representation Alignment for Vision-Language-Action Model" (Fuhao Li 외, 2025년 10월)으로, 2D 시각 정보에 국한된 VL

2026년 5월 2일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] VLA-RFT: VISION-LANGUAGE-ACTION REINFORCEMENT FINE-TUNING WITH VERIFIED REWARDS IN WORLD SIMULATORS

본 논문은 Vision-Language-Action(VLA) 모델의 모방 학습(Imitation Learning)이 지닌 한계를 극복하기 위해, 데이터 기반의 세계 모델(World Model)을 시뮬레이터로 활용하는 강화 미세조정(Reinforcement Fine-Tu

2026년 4월 29일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] CodeGraphVLP: Code-as-Planner Meets Semantic-Graph State for Non-Markovian Vision-Language-Action Models

본 논문은 비마르코프(Non-Markovian) 환경의 장기(Long-horizon) 로봇 조작 한계를 극복하기 위해, 지속적인 '의미론적 그래프(Semantic-Graph)' 상태와 '코드 기반 계획기(Code-as-Planner)'를 결합한 CodeGraphVLP

2026년 4월 27일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] Long-Horizon Manipulation via Trace-Conditioned VLA Planning

목적 및 제안 방법: 긴 시계열(Long-horizon) 로봇 조작의 복잡성을 해결하기 위해 고수준의 작업 관리자(VLM)와 저수준의 실행기(VLA)를 분리하고, 2D 시각적 궤적(Trace)을 매개체로 연결하는 LoHo-Manip 프레임워크를 제안함.기술적 차별성:

2026년 4월 27일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] PersonaVLM: Long-Term Personalized Multimodal LLMs

본 논문은 멀티모달 대형 언어 모델(MLLM)이 사용자의 진화하는 선호도와 성격을 장기적으로 학습하고 유지하지 못하는 문제를 해결하기 위해 PersonaVLM 프레임워크를 제안함.기억(Memory), 추론(Reasoning), 응답 정렬(Response Alignmen

2026년 4월 24일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] Near-Future Policy Optimization

본 논문은 강화학습(RLVR) 기반의 언어 모델 튜닝에서, 현재 정책보다 조금 앞선 '가까운 미래(Near-Future)' 체크포인트가 생성한 정답 궤적을 활용하여 학습을 최적화하는 NPO(Near-Future Policy Optimization)를 제안한다.외부 교사

2026년 4월 24일
·
0개의 댓글
·
post-thumbnail

[논문 리뷰] DiPO: Disentangled Perplexity Policy Optimization for Fine-grained Exploration-Exploitation Trade-Off

본 논문은 대형 언어 모델(LLM)의 강화학습 과정에서 발생하는 극단적 샘플(전체 정답 또는 전체 오답)의 기울기 소실 및 비효율적 탐색-활용 딜레마를 해결하기 위한 DiPO(Disentangled Perplexity Policy Optimization)를 제안한다.퍼

2026년 4월 24일
·
0개의 댓글
·