산업 IoT에 대한 AI와 에지 컴퓨팅을 결합한 DeepSeek-R1

소개

DeepSeek-R1의 소형 증류 모델은 DeepSeek-R1에 의해 생성 된 체인의 체인 데이터를 사용하여 미세 조정됩니다....R1의 추론 능력을 상속하는 태그. 이 미세 조정 된 데이터 세트에는 문제 분해 및 중간 공제와 같은 추론 프로세스가 명시 적으로 포함됩니다. 강화 학습은 증류 모델의 행동 패턴을 R1에 의해 생성 된 추론 단계와 정렬했습니다. 이 증류 메커니즘을 사용하면 소규모 모델이 계산 효율성을 유지하면서 더 큰 모델의 근처에서 복잡한 추론 능력을 얻을 수 있으며, 이는 자원으로 제한 된 시나리오에서 상당한 적용 값입니다. 예를 들어, 14B 버전은 원래 DeepSeek-R1 모델의 코드 완료의 92%를 달성합니다. 이 기사는 특정 구현 사례와 함께 다음 4 방향으로 요약 된 DeepSeek-R1 증류 모델과 산업 엣지 컴퓨팅의 핵심 응용 프로그램을 소개합니다.

DC3C637C5BEAD8B62ED51B6D83AC0B4

장비의 예측 유지 보수

기술 구현

센서 퓨전 :

MODBUS 프로토콜 (샘플링 속도 1 kHz)을 통해 PLC의 진동, 온도 및 현재 데이터를 통합합니다.

기능 추출 :

Jetson Orin NX에서 가장자리 충동을 실행하여 128 차원 시계열 기능을 추출하십시오.

모델 추론 :

DeepSeek-R1-Distill-14B 모델을 배포하고 기능 벡터를 입력하여 결함 확률 값을 생성합니다.

동적 조정 :

신뢰할 때 유지 보수 작업 주문을 트리거하고 60%<60%일 때 2 차 검증 프로세스를 시작합니다.

관련 사례

Schneider Electric 은이 솔루션을 채굴 기계에 배치하여 오 탐지율을 63%, 유지 보수 비용을 41% 줄였습니다.

1

inhand ai edge 컴퓨터에서 Deepseek R1 증류 모델 실행

향상된 육안 검사

출력 아키텍처

일반적인 배포 파이프 라인 :

카메라 = gige_vision_camera (500fps) # gigabit 산업용 카메라
frame = camera.capture () # 캡처 이미지
사전 처리 = OpenCV.Denoise (프레임) # 전처리를 비난합니다
defect_type = deepseek_r1_7b.infer (사전 처리) # 결함 분류
defect_type! = '정상'인 경우 :
plc.trigger_reject () # 트리거 정렬 메커니즘

성능 지표

처리 지연 :

82ms (Jetson Agx Orin)

정확성:

사출 성형 결함 검출은 98.7%에 도달합니다.

2

DeepSeek R1의 시사점 : 생성 AI Value Chain의 우승자 및 패자

프로세스 흐름 최적화

주요 기술

자연어 상호 작용 :

연산자는 음성을 통해 장비 이상을 설명합니다 (예 : "압출기 압력 변동 ± 0.3 MPa").

멀티 모달 추론 :

이 모델은 장비 기록 데이터 (예 : 스크류 속도 조정)를 기반으로 최적화 제안을 생성합니다.

디지털 트윈 검증 :

Edgex Foundry 플랫폼의 파라미터 시뮬레이션 유효성 검사.

구현 효과

BASF의 화학 공장은이 계획을 채택하여 에너지 소비의 17% 감소 및 제품 품질 속도의 9% 증가를 달성했습니다.

3

Edge AI 및 비즈니스의 미래 : 의료, 자동차 및 IIOT 용 Openai O1 vs. Deepseek R1

지식 기반의 즉각적인 검색

건축 디자인

로컬 벡터 데이터베이스 :

ChromADB를 사용하여 장비 매뉴얼 및 프로세스 사양을 저장하십시오 (Dimension 768 포함).

하이브리드 검색 :

쿼리에 대해 BM25 알고리즘 + 코사인 유사성을 결합하십시오.

결과 생성 :

R1-7B 모델은 검색 결과를 요약하고 개선합니다.

일반적인 경우

Siemens 엔지니어는 자연어 쿼리를 통해 인버터 고장을 해결하여 평균 처리 시간이 58%감소했습니다.

배포 과제 및 솔루션

메모리 제한 :

KV 캐시 양자화 기술을 활용하여 14B 모델의 메모리 사용량을 32GB에서 9GB로 줄였습니다.

실시간 성능 보장 :

CUDA 그래프 최적화를 통해 단일 추론 대기 시간을 ± 15ms로 안정화했습니다.

모델 드리프트 :

주간 증분 업데이트 (매개 변수의 2% 만 전송).

극단적 인 환경 :

IP67 보호 수준을 사용하여 -40 ° C ~ 85 ° C의 넓은 온도 범위를 위해 설계되었습니다.

5
微信图片 _20240614024031.jpg1

결론

현재 배포 비용은 이제 3C 제조, 자동차 조립 및 에너지 화학과 같은 부문에서 확장 가능한 응용 프로그램을 형성하여 현재 599 달러/노드 (Jetson Orin NX)로 감소했습니다. MOE 아키텍처 및 양자화 기술의 지속적인 최적화는 2025 년 말까지 70B 모델이 Edge 장치에서 실행될 수 있도록 할 것으로 예상됩니다.

ELV 케이블 솔루션을 찾으십시오

제어 케이블

BMS, 버스, 산업, 계측 케이블 용.

구조화 된 케이블 링 시스템

네트워크 및 데이터, 광섬유 케이블, 패치 코드, 모듈, 페이스 플레이트

2024 전시회 및 이벤트 검토

두바이의 2024 년 4 월 16 일 -18 일

2024 년 4 월 16 일 -18 일, 2024 년 모스크바에서 Securika

2024 년 5 월 9 일, 상하이에서 열린 새로운 제품 및 기술 출시 이벤트

2024 년 10 월 22 일 25 일, 베이징에서 중국 보안 중국

2024 년 11 월 19 일 -20 일 Connected World KSA


시간 후 : 2 월 7 일 -202555555 년