스트림 프로세서, Inc.
Stream Processors, Inc![]() | |
유형 | 사설 |
---|---|
산업 | 반도체 전문화 |
설립됨 | 2004 |
본부 | 미국 캘리포니아 주 서니베일 |
주요인 | 빌 달리, 공동 창업자 겸 전 회장 |
상품들 | 디지털 신호 처리기 |
직원수 | 약 100(2007) |
웹사이트 | www.streamprocessors.com |
스트림 프로세서 주식회사는 실리콘밸리에 본사를 둔 팹리스 반도체 회사로 비디오 보안 감시, 다기능 프린터, 화상회의 등 응용분야를 위한 고성능 디지털 신호 프로세서의 설계 및 제조를 전문으로 했다.그 회사는 2009년에 영업을 중단했다.null
회사이력
하천 공정의 기초 작업은 1995년 MIT 교수인 Bill Dally에 의해 시작되었다.1996년 그는 스탠포드 대학교로 이사하여 이 작업을 계속했으며, 인텔과 텍사스 인스트루먼트로부터 추가 자원과 함께 수백만 달러의 보조금을 지원받아 최초의 스트림 프로세서 칩과 그에 수반되는 컴파일러 도구인 "Imagine"이라는 프로젝트의 개발을 후원했다.null
이매진 프로젝트
이매진 프로젝트의 목표는 특수 목적 프로세서(예: 유선 연결된 ASIC)의 성능 밀도와 효율성을 모두 제공하기 위한 C 프로그래밍 가능한 신호와 이미지 프로세서를 개발하는 것이었다.그 프로젝트는 성공적으로 스트림 처리의 장점을 입증했다.이매진 프로젝트와 그 결과에 대한 자세한 내용은 스탠포드 이매진 프로젝트 페이지에 게시되어 있다.이 연구는 또한 무선 베이스밴드 처리, 3D 그래픽, 암호화, IP 포워딩, 비디오 처리까지 다양한 어플리케이션들이 스트림 처리의 효율성을 이용할 수 있다는 것을 보여주었다.이 연구는 ATI 테크놀로지의 GPU와 소니, 도시바, IBM의 셀 마이크로프로세서와 같은 다른 디자인에 영감을 주었다.null
Imagine 프로그램의 주요 결과물은 다음과 같다.
- 이매진 스트림 건축
- 스트림 프로그래밍 모델
- 소프트웨어 개발 도구
- 프로그래밍 가능한 그래픽 및 실시간 미디어 애플리케이션
- VLSI 프로토타입(TI에 의해 조립)
- 스트림 프로세서 개발 플랫폼(시제품 개발 보드)
SPI 설정
달리는 다른 팀원들과 함께 스탠포드로부터 그 결과 기술을 상용화할 수 있는 라이선스를 취득했다.Stream Processors, Incorporated (SPI)는 2004년에 캘리포니아에 통합되었다.달리 교수는 스탠포드에 남았고 그 회사는 그 해 12월에 사장 겸 CEO가 되기 위해 업계 베테랑인 칩 스턴스[1]를 고용했다.2006년 6월까지 SPI는 오스틴 벤처스, 노르웨스트 벤처 파트너스, 우드사이드 펀드 등 3개 유명 벤처캐피털 기업으로부터 총 2,600만 달러를 모금할 수 있었다.null
동사는 2006년[1] 2월 국제고체회로학회(ISSCC)와 동시에 첫 2개 제품을 출시했고 이후 2개 제품을 선보였다.[2][3]null
SPI는 캘리포니아주 서니베일에 본사를 두고 있으며, 인도 방갈로르에 위치한 소프트웨어 개발 그룹(SPI Software Technologies Pvt. Ltd)도 있다.null
2009년 1월 공동창업자 교수.빌 달리는 엔비디아 사의 수석 과학자 자리를 수락했다.[4]동시에 그는 의장직에서 사임했다.[5]달리는 인터뷰에서 "나는 칩 스타트업을 여러 번 해봤다.[5]점점 어려워지고 있다.ante가 매우 높다.칩 스타트업을 한다면 주머니가 매우 넉넉한 인내심 있는 투자자가 필요하다.첫 상품에 도달하는 데는 수천만 달러, 이익을 얻는 데는 5천만 달러가 든다.투자자들은 그 투자에 대해 일부 배수진을 치고 싶어하기 때문에 그것은 매우 어렵다.나는 우리가 IPO가 빈번했던 시대로 돌아가서 화재 판매 인수를 극복하기를 희망한다.지금 네가 볼 수 있는 건 그게 아니야.프로그램 가능한 칩이라면 비용은 더 많이 든다"고 말했다.
Stearns CEO는 2009년 여름 회사를 그만두고 Cadence Design Systems와 Intel에서 수석급 경력을 가진 임원인 Mike Fister로 교체되었다.null
2009년 9월에 그 회사는 영업을 중단했다.[6]null
기술
그래픽과 과학 컴퓨팅과 마찬가지로 미디어와 신호 처리도 이용 가능한 데이터 병렬화, 위치성, 높은 계산 대 글로벌 메모리 액세스 비율이 특징이다.스트림 프로세싱은 컴파일러에 의해 관리되는 분산 메모리 계층에 의해 공급되는 데이터 병렬 프로세싱을 사용하여 이러한 특성을 활용한다.차세대 대규모 병렬 프로세서의 주요 과제는 계산 자원이 아닌 데이터 대역폭이다.대부분의 기존 프로세서와 달리, 이 기술은 하드웨어 캐시에 의존하지 않고, 대신 데이터 이동이 컴파일러와 하드웨어에 의해 명시적으로 관리된다.null
실행 모델은 데이터 레코드(스트림)를 처리하고 생산하는 성능 크리티컬 기능(커널)을 가속화하는 것을 기반으로 한다.커널과 스트림은 컴파일 시간에 예약되고 스코어보드를 통해 런타임에 온칩 메모리로 이동된다.컴파일러는 스트림의 데이터 실시간 시간을 분석하여 할당을 최적화하고 외부 메모리 대역폭 요구를 최소화한다.스트림 및 커널 로드는 지연 시간 내성을 개선하기 위해 실행과 중복될 수 있으며 명시적 데이터 이동은 예측 가능한 성능을 제공한다.CPU 캐시 누락은 없으며 설계는 프로그래머에게 단일 코어 모델을 제시한다. 즉, 데이터 병렬은 커널 내에 있다.null
건축
아키텍처에는 시스템 수준 작업을 위한 호스트 CPU(시스템 MIPS)와 DSP MIPS가 커널 함수를 데이터 병렬 장치(DPU)로 호출하는 메인 스레드를 실행하는 DSP 코프로세서 서브시스템이 포함된다.라이브러리를 사용하고 DSP 코드를 개발하지 않으려는 사용자를 위해 아키텍처는 "블랙 박스" 코프로세서에 API를 제공하는 MIPS 기반 시스템 온 어 칩이다.DPU Dispatcher는 런타임 커널과 스트림 로드를 관리하기 위한 커널 함수 호출을 수신한다.각 차선의 Lane Register File에 저장된 로컬 스트림 데이터로 작동하면서 차선을 가로질러 한 번에 하나의 커널이 실행된다.각 차선에는 VLIW ALU 세트가 있으며, 분산 운영자 레지스터 파일(ORF)은 1테라바이트/s를 초과하는 대량의 작업 데이터 세트와 처리 대역폭을 허용한다.Stream Load/Store Unit은 다양한 액세스 패턴을 수집/스캐터를 제공한다.인터레인 스위치는 차선 간 고속 접근을 위한 컴파일러로 예정된 완전한 크로스바이다.null
도구들
SPI의 RapiDev Tools Suite는 스트림 처리의 예측 가능성을 활용하여 C 프로그래밍을 사용하여 최적화된 결과를 신속하게 얻을 수 있는 경로를 제공한다.C 참조 코드를 시작으로 FPD(Fast Functional Debugger) 라이브러리는 마이크로소프트 비주얼 스튜디오, GNU와 같은 표준 툴에 연결되고 DPU를 시뮬레이션하여 커널과 스트림에 대한 코드 재구성을 지원한다.커널은 정적으로 스케줄링되어 있고 데이터 이동이 명확하기 때문에 이 기능적인 높은 수준에서도 DPU 사이클 정확도를 얻을 수 있다.이것은 구조의 예측가능성의 한 원천이다.장치에 대한 코드를 타겟팅하기 위해 스트림 프로세서 컴파일러(SPC)는 MIPS용 표준 GCC를 통해 컴파일/연계되는 VLIW 실행 가능 및 사전 처리된 C 코드를 생성한다. SPC는 레인 레지스터 파일에 스트림을 할당하고 커널 함수 호출에 대한 종속성 정보를 제공한다.소프트웨어 파이프라인 및 루프 언롤링이 지원된다.지점 벌칙은 사전에 결정된 선택으로 피하며, 규모가 큰 조건자는 조건부 스트림을 사용한다.Eclipse에서 실행되는 Target Code Simulator는 대역폭과 부하 통계로 중단점과 단일 스텝 기능을 갖춘 포괄적인 호스트 또는 장치 바이너리 코드 시뮬레이션을 제공한다.커널 뷰는 커널 최적화를 위한 VLIW 파이프라인, 스트림 뷰는 커널 실행 및 스트림 로드를 보여 시스템 프로파일링을 위한 글로벌 데이터 이동을 검토한다.null
상품들
SPI는 현재 다양한 성능 수준의 4개의 소프트웨어 프로그램 가능 DSP를 포함하는 Storm-1 제품군을 판매하고 있다.null
제품 | GMACS* | 적용들 |
---|---|---|
SP16HP-G220 | 224 |
|
SP16-G160 | 160 |
|
SP8-G80 | 80 |
|
SP8LP-G30 | 32 |
|
참고: GMACS는 DSP 성능의 일반적인 척도인 초당 곱셈-아큐뮬레이션 작업을 의미한다.null
하드웨어 및 소프트웨어 지원
- RapiDev 툴 제품군은 최적화된 결과를 얻을 수 있는 빠르고 예측 가능한 경로를 제공하여 조립품 코딩 또는 수동 캐시 관리의 복잡성을 제거함
- Storm-1 DevKit는 PCI 기반 소프트웨어 개발 플랫폼이다.
- IP Camera Reference Design은 표준 Linux 2.6을 실행하며 다중 동시 코덱(예: H.264, MPEG-4, MJPEG), 임의 해상도, CMOS, CCD 센서 처리 및 완전한 소프트웨어 프로그램 가능 플랫폼에서 비디오 분석을 지원한다.
- Video Streamer Reference Design은 H.264로 압축된 비디오의 8개의 4CIF 입력 채널과 기가비트 이더넷 출력을 지원한다.
참조
- ^ EETimes.com - DSP용 스트림 처리 아키텍처 시작
- ^ 비용에 민감한 비디오 보안 감시 앱을 위한 데이터 병렬 DSP Video Imaging DesignLine
- ^ EETimes.com - 스트림 프로세서가 가장 빠른 DSP를 요구함
- ^ "Home".
- ^ a b "Stanford's Bill Dally leaps from academia to the computer graphics wars". 22 May 2009.
- ^ http://sanjose.bizjournals.com/sanjose/stories/2009/11/02/daily124.html