'DataBase' 카테고리의 글 목록 (3 Page)

DataBase

MSSQL-XQuery에 대해서...

중년 플머 김씨 2013. 3. 8. 09:41

2013. 3. 8. 09:41

XQuery 지원기능

XQuery는 XML에 대한 쿼리 언어입니다. XML 데이터를 조회하기 위한 XQuery 표현식 기반 xml 데이터형의 메서드를 살펴보고 XQuery 구문에 대해서 살펴봅니다. XQuery 구문에는 XPath 2.0 표현식이 포함되어 있으며, XQuery를 사용하여 XML 데이터원본에 복잡한 쿼리를 실행할 수 있습니다. SQL Server 에 제공하는 xml 데이터형에서는 XQuery 표현식을 사용하여 xml 데이터를 조회하고 변경하기 위해서 사용할 수 있는 메서드를 제공합니다.
SQL Server 2005의 XQuery 지원기능은 W3C XQuery 1.0 언어 스펙을 기초로 합니다.
( http://www.w3.org/XML/Query 참조)

XQuery 구문

XQuery는 크게 두가지 부분으로 구성됩니다. 네임스페이스를 선언하고, 스키마를 추가하기 위한 머리글 부분(생략가능)과 xml 데이터를 조회하기 위해서 사용하는 실제 XQuery 표현식이 포함된 본문 부분으로 나눌 수 있습니다. XQuery 표현식은 조회하고자 하는 XML 노드에 대한 간략한 경로 정보일 수도 있고, XML 결과를 생성하기 위한 복잡한 표현식일 수도 있습니다.

XQuery 경로는 XPath 언어를 기반으로 하며, XML 문서상에서 조회하고자 하는 노드의 위치를 나타냅니다. 경로는 절대경로(루트 엘리먼트로부터 XML 트리의 특정 노드의 위치를 표현)로 지정될 수도 있고, 상대경로(이미 알려진 노드로부터 조회하고자 하는 노드의 위치를 상대적으로 표현)로 지정될 수도 있습니다. 다음의 표는 간단한 XQuery 경로 예제를 나타냅니다.

예제 경로	설명
/InvoiceList/Invoice	<INVOICELIST>루트 엘리먼트에 포함되어 있는 모든 <INVOICE>엘리먼트</INVOICE></INVOICELIST>
(/InvoiceList/Invoice) [2]	<INVOICELIST>루트 엘리먼트에 포함되어 있는 두번째 <INVOICE>엘리먼트</INVOICE></INVOICELIST>
(InvoiceList/Invoice/@InvoiceNo) [1]	<INVOICELIST>루트 엘리먼트에 포함되어 있는 첫번째 <INVOICE>엘리먼트의 InvoiceNo 속성</INVOICE></INVOICELIST>
(InvoiceList/Invoice/Customer/text( ))[1]	<INVOICELIST>루트 엘리먼트에 포함되어 있는 <INVOICE>엘리먼트의 하위 첫번째 <CUSTOMER>엘리먼트의 텍스트</CUSTOMER></INVOICE></INVOICELIST>
/InvoiceList/Invoice[@InvoiceNo=1000	<INVOICELIST>루트 엘리먼트에 포함되어 있는 모든 <INVOICE>엘리먼트 중에서 InvoiceNo 속성이 1000인 <INVOICE>엘리먼트</INVOICE></INVOICE></INVOICELIST>

FLOWR 문장

XQuery 언어 스펙에 포함되어 있는 for, let, order by, where, return 문장을 통상적으로 FLOWR “( flower”라고 읽음) 라고 부릅니다. SQL Server 2005에서는 for, where, return 문장을 지원하며, 각각의 사용용도는 다음과 같습니다.

문장	설명
For	XML 문서의 동일 수준의 노드를 반복하며 처리하기 위해서 사용합니다.
Where	노드를 반복처리할 때 필터링 조건을 지정하기 위해서 사용합니다. XQuery 언어에는 Where 문장과 함께 사용할 수 있는 count( )와 같은 함수가 포함되어 있습니다.
Return	반복구조내에서 반환할 XML을 지정하기 위해서 사용합니다.

다음의 예제는 각 엘리먼트별로 자식 엘리먼트에 포함된 하나 이상의 엘리먼트의 목록을 반환합니다.

for $i in /InvoiceList/Invoice
where count($i/Items/Item) > 1
return $i

XQuery 표현식 사용예제

XQuery 표현식 중 가장 일반적으로 사용되는 유형을 예제와 함께 소개합니다.

원본XML
   <InvoiceList>
      <Invoice InvoiceNo=”1000”>
         <Customer>Kim Abercrombie</Customer>
         <Items>
            <Item Product=”1”Price=”1.99”Quantity=”2”/>
            <Item Product=”3”Price=”2.49”Quantity=”1”/>
         </Items>
      </Invoice>
      <Invoice InvoiceNo=”1001”>
         <Customer>Sean Chai</Customer>
         <Items>
            <Item Product=”1”Price=”1.99”Quantity=”2”/>
      </Items>
   </Invoice>
</InvoiceList>

단순한 XQuery 표현식 사용

구문 : /InvoiceList/Invoice

결과값
   <Invoice InvoiceNo=”1000”>
      <Customer>Kim Abercrombie</Customer>
      <Items>
         <Item Product=”1”Price=”1.99”Quantity=”2”/>
         <Item Product=”3”Price=”2.49”Quantity=”1”/>
      </Items>
   </Invoice>
   <Invoice InvoiceNo=”1001”>
      <Customer>Sean Chai</Customer>
      <Items>
         <Item Product=”1”Price=”1.99”Quantity=”2”/>
   </Items>
   </Invoice>

XQuery 조건 사용

구문 : /InvoiceList/Invoice[@InvoiceNo=1000]

결과값
   <Invoice InvoiceNo=”1000”>
      <Customer>Kim Abercrombie</Customer>
      <Items>
         <Item Product=”1”Price=”1.99”Quantity=”2”/>
         <Item Product=”3”Price=”2.49”Quantity=”1”/>
      </Items>
   </Invoice>

For 문장과 Return 문장 사용

구문
for $i in /InvoiceList/Invoice/Items/
Item[../../@InvoiceNo=1000]
return $i

결과값
   <Item Product=”1”Price=”1.99”Quantity=”2”/>
   <Item Product=”3”Price=”2.49”Quantity=”1”/>

For 문장과 Return 문장을 사용하여 XML 생성

구문
<OrderedItems>
   {
      for $i in /InvoiceList/Invoice/Items/Item
      return $i
   }
</OrderedItems>

결과값
<OrderedItems>
      <Item Product=”1”Price=”1.99”Quantity=”2”/>
      <Item Product=”3”Price=”2.49”Quantity=”1”/>
      <Item Product=”1”Price=”1.99”Quantity=”2”/>
</OrderedItems>

For 문장과 Return 문장을 사용하여 속성과 값을 반환

구문
<OrderedItems>
{
for $i in /InvoiceList/Invoice/Items/Item
return <Product>
{$i/@Quantity}
{string($i/@Product)}
</Product>
}
</OrderedItems>

결과값
   <OrderedItems>
      <Product Quantity=”2”>1</Product>
      <Product Quantity=”1”>3</Product>
      <Product Quantity=”2”>1</Product>
   </OrderedItems>

For, Where, Return 문장 사용

구문
<MultiItemInvoices>
{
for $i in /InvoiceList/Invoice
where count($i/Items/Item) > 1
return $i
}
</MultiItemInvoices>

결과값
   <MultiItemInvoices>
      <Invoice InvoiceNo=”1000”>
         <Customer>Kim Abercrombie</Customer>
         <Items>
            <Item Product=”1”Price=”1.99”Quantity=”2”/>
            <Item Product=”3”Price=”2.49”Quantity=”1”/>
         </Items>
   </Invoice>
</MultiItemInvoices>

머리글에 네임스페이스 지정

구문
   declare namespace awi =
   “http://schemas.adventure-works.com/Invoices”;
   /awi:InvoiceList/awi:Invoice[@InvoiceNo=1000]

결과값
   <awi:Invoice xmlns:awi=”http://schemas.adventure-works.com/Invoices”
                  InvoiceNo=”1000”>
         <awi:Customer>Kim Abercrombie</awi:Customer>
         <awi:Items>
            <awi:Item Product=”1”Price=”1.99”Quantity=”2”/>
            <awi:Item Product=”3”Price=”2.49”Quantity=”1”/>
         </awi:Items>
   </awi:Invoice>

기본 네임스페이스 사용

구문
   declare default namespace =
   “http://schemas.adventure-works.com/Invoices”;
   /InvoiceList/Invoice[@InvoiceNo=1000]

결과값
   <Invoice xmlns=”http://schemas.adventure-works.com/Invoices”
            InvoiceNo=”1000”>
       <Customer>Kim Abercrombie</Customer>
           <Items>
             <Item Product=”1”Price=”1.99”Quantity=”2”/>
             <Item Product=”3”Price=”2.49”Quantity=”1”/>
          </Items>
   </Invoice>

XML 데이터형에서 제공하는 메서드를 사용하여 쿼리실행

SQL Server 2005 XML 데이터형은 XML 데이터를 쿼리하고 수정하기 위해서 사용할 수 있는 네 가지 메서드를 제공합니다. 각 메서드는 대부분의 개발자에게 익숙한 구문인 데이터형.메서드_명칭으로 호출할 수 있습니다. 각 메서드의 기능에 대해서 이해하면, XML 데이터를 데이터베이스에서 처리하는 어플리케이션을 개발하는데 도움이 될 것입니다.

Query 메서드

Query 메서드는 XML 데이터형에 저장된 데이터에서 XML을 추출하기 위해서 사용합니다. Query 메서드의 매개변수로 전달되는 XQuery 표현식에 지정된 결과값이 조회됩니다.

SELECT xmlCol.query‘( declare default namespace =
“http://schemas.adventure-works.com/InvoiceList”;
<InvoiceNumbers>
{
for $i in /InvoiceList/Invoice
return <InvoiceNo>
{number($i/@InvoiceNo)}
</InvoiceNo>
}
</InvoiceNumbers>’

Value 메서드

Value 메서드는 XML 문서로부터 단일 값을 반환하기 위해서 사용합니다. value 메서드를 사용하기 위해서는 XQuery 표현식을 XML 데이터에 포함된 단일 노드를 식별할 수 있는 형태로 지정해야 하며, 반환되는 값이 T-SQL 데이터형이 되도록 지정해야 합니다.

SELECT xmlCol.value‘( declare default namespace =
“http://schemas.adventure-works.com/InvoiceList”;
/InvoiceList/Invoice/@InvoiceNo)[1]’,‘ int’

Exist 메서드

Exist 메서드는 XML 문서에 지정된 노드가 존재하는지 여부를 판단하기 위해서 사용합니다.
Exist 메서드가 1을 반환하면, 지정된 노드가 XML 문서내에서을 반환하면, 지정된 노드가 존재하지 않는다는 것을 의미합니다.

SELECT xmlCol.exist‘( declare default namespace =
“http://schemas.adventure-works.com/InvoiceList”;
/InvoiceList/Invoice[@InvoiceNo=1000]’

관계형 테이블의 컬럼과 변수의 바인딩

SQL Server 2005에서는 XQuery 언어를 사용하여 xml 데이터형 컬럼을 조회하기 위한 메서드가 포함된 SELECT 문장에서, 관계형 데이터 컬럼을 참조할 수 있도록 지원합니다. XML 데이터형 컬럼으로부터 XML 데이터를 조회하기 위해, XML 데이터형 메서드가 포함된 SELECT 문장에서, sql:column 함수를 사용하여, XML 데이터안에 비-xml 데이터 컬럼값을 포함시킬 수 있습니다. 또한, sql:variable 확장을 사용하여, 저장 프로시저내에서 변수를 참조할 수 있습니다. XML 데이터내부에 비-xml 컬럼 값을 포함시키기 위해, sql:column 함수를 사용하는 예제는 다음과 같습니다.

SELECT StoreName, Invoices.query‘( declare default namespace=
“http://schemas.adventure-works.com/Invoices”;
<Invoices>
<Store>{sql:column“( StoreName”)}</Store>
{
for $i in /InvoiceList/Invoice
return $i
}
</Invoices>’) InvoicesWithStoreName
FROM Stores

Modify 메서드를 사용하여 XML 데이터 변경

XML 데이터형 컬럼에 저장된 XML 데이터를 변경하기 위해서 Modify 메서드를 사용합니다.
Modify 메서드는 XQuery 언어 스펙에 대해 insert, replace, delete 확장기능을 지원합니다. 세 가지 확장기능은 XML DML로서 참조할 수 있습니다.

INSERT 문장을 사용하여 XML 데이터에 노드를 추가할 수 있습니다.
REPLACE 문장을 사용하여 XML 데이터를 변경할 수 있습니다.
DELETE 문장을 사용하여 XML 데이터에서 특정 노드를 삭제할 수 있습니다.

INSERT 문장

Modify 메서드와 함께 INSERT 문장을 사용하여, XML 데이터형 컬럼이나 변수에 저장된 XML 데이터에 노드를 추가할 수 있습니다. INSERT 문장에 대한 구문은 다음과 같습니다.

insert Expression1 (
{as first | as last} into | after | before
Expression2 )

INSERT 키워드에 지정할 수 있는 매개변수는 다음과 같습니다.

매개변수	설명
Expression1	추가될 노드를 지정하기 위한 표현식으로, XML 문자열 형식으로 지정해야 합니다. (예를 들어,<Item Product=”5”Quantity=”1”/>) 또한, 텍스트 노드에 추가할 엘리먼트 표현식을 지정할 수도 있습니다. (예를 들어, element SalesPerson {“ Bill”}) 마지막으로, 속성에 추가할 속성 표현식을 지정할 수 있습니다. (예를 들어, attribute discount {“ 1.50”})
as first	계층구조의 첫번째 노드에 새로운 XML을 추가하기 위해서 사용합니다.
as last	계층구조의 마지막 노드에 새로운 XML을 추가하기 위해서 사용합니다.
Into	Expression2 위치에 Expression1을 추가하기 위해서 사용합니다.
After	Expression2 뒤에 Expression1을 추가하기 위해서 사용합니다.
Before	Expression2 앞에 Expression1을 추가하기 위해서 사용합니다.
Expression2	XML 문서에 포함된 기존 노드를 지정하기 위한 XQuery 표현식.

다음 예제는 Modify 메서드와 함께 INSERT Xquery 문장을 사용하는 방법을 나타냅니다.

SET @xmlDoc.modify
‘( declare default namespace = “ http://schemas.adventureworks.
com/InvoiceList”;
   insert element salesperson “{ Bill”}
   as first into (/InvoiceList/Invoice)[1]’

replace 문장

XML 데이터를 변경하기 위해서 modify 메서드와 함께 REPLACE 문장을 사용합니다.
REPLACE 문장에 대한 구문은 다음과 같습니다.

replace value of
Expression1
with
Expression2

REPLACE 문장에서 사용할 수 있는 매개변수는 다음과 같습니다.

매개변수	설명
Expression1	값을 변경할 노드를 지정하기 위한 XQuery 표현식
Expression2	대체할 노드에 새로 지정할 값

다음의 예제는 Modify 메서드와 함께 REPLACE 문장을 사용하는 방법을 나타냅니다.

SET xmlCol.modify
 ‘( declare default namespace =”http://schemas.adventure-works.com/InvoiceList”;
       replace value of (/InvoiceList/Invoice/SalesPerson/text( ))[1]
       with“ Ted”’)

DELETE 문장

XML 데이터에서 지정된 노드를 삭제하기 위해서 Modify메서드와 함께 DELETE 문장을 사용합니다. DELETE 문장에 대한 구문은 다음과 같습니다.

delete Expression

Expression 매개변수는 삭제할 노드를 지정하기 위한 XQuery 표현식입니다. 다음 예제는 modify 메서드와 함께 DELETE 문장을 사용하는 방법을 나타냅니다.

SET xmlCol.modify
‘( declare default namespace =”http://schemas.adventure-works.com/InvoiceList”;
    delete (/InvoiceList/Invoice/SalesPerson)[1]’)

Nodes 메서드를 사용하여 XML 데이터 부분추출

Xml 데이터형에서는 nodes 메서드를 통해, XML 데이터를 관계형 테이블 형식으로 생성할 수 있는 기능을 제공합니다. Nodes 메서드는 XQuery 표현식으로 지정된 각 노드를 행집합 형식으로 반환합니다.

nodes 메서드의 구문은 다음과 같습니다.

xmlvalue.nodes (XQuery) [AS] Table(Column)

Nodes 메서드에서 사용할 수 있는 매개변수는 다음과 같습니다.

매개변수	설명
Xmlvalue	XML 데이터형 변수 또는 컬럼
XQuery	반환하고자 하는 노드를 지정하기 위한 XQuery 표현식
Table(Column)	결과값으로 반환할 테이블명과 컬럼명. 결과값 테이블은 순차적으로 수행되는 쿼리에서 데이터를 추출하기 위한 원본으로 사용될 수 있습니다.

Xml 데이터형 변수나 컬럼에서 nodes 메서드를 사용하여 관계형 테이블 형식의 데이터를 조회할 수 있습니다.

XML 데이터형 변수에서 관계형 테이블 형식의 데이터를 추출하기 위해서, nodes 메서드에서
반환하는 결과행집합에 대해서, query, value, exist와 같은 메서드를 사용합니다.
Xml 데이터형 컬럼에서 관계형 테이블 형식의 데이터를 반환하기 위해서, nodes 메서드와 함께
APPLY 연산자를 사용합니다.

XML 변수에 대해 nodes 메서드 사용법

Xml 데이터형 변수에서 관계형 테이블 형식의 데이터를 추출하기 위해서, nodes 메서드에서 반환하는 행집합에 query, value, exist 메서드를 사용할 수 있습니다. 다음 예제는 xml 변수에서 관계형 테이블 형식의 주문 데이터를 추출하는 방법을 나타냅니다.

DECLARE @xmlOrder xml
SET @xmlOrder =‘ <?xml version=”1.0”?>
   <Order OrderID=”1000”OrderDate=”2005-06-04”>
      <LineItem ProductID=”1”Price=”2.99”Quantity=”3”/>
      <LineItem ProductID=”2”Price=”3.99”Quantity=”1”/>
   </Order>’

SELECT nCol.value‘( @ProductID’,‘ integer’) ProductID,
   nCol.value‘( @Quantity’,‘ integer’) Quantity
FROM @xmlOrder.nodes‘( /Order/LineItem’) AS nTable(nCol)

위의 코드를 실행하면 다음과 같은 결과가 반환됩니다.

ProductID	Quantity
1	3
2	1

XML 컬럼에 대해 nodes 메서드 사용하는 방법

Xml 컬럼에서 관계형 테이블 형식의 데이터를 반환하게 하기 위해서, nodes 메서드와 함께 APPLY 연산자를 사용합니다. 다음 예제는 nodes 메서드를 사용하여 XML 컬럼으로부터 주문 데이터를 추출하는 방법을 나타냅니다.

SELECT nCol.value‘( ../@OrderID[1]’,‘ int’) OrderID,
   nCol.value‘( ../@OrderDate[1]’,‘ datetime’) OrderDate,
   nCol.value‘( @ProductID[1]’,‘ int’) ProductID,
   nCol.value‘( @Price[1]’,‘ money’) Price,
   nCol.value‘( @Quantity[1]’,‘ int’) Quantity
FROM Orders_X
CROSS APPLY OrderDoc.nodes‘( /Order/LineItem’) AS nTable(nCol)

위의 코드는 다음과 같은 결과값을 반환합니다.

OrderID	OrderDate	ProductID	Price	Quantity
1000	2005-06-04 00:00:00.000	1	2.99	1
1000	2005-06-04 00:00:00.000	2	3.99	2
1000	2005-06-04 00:00:00.000	2	3.99	1
1002	2005-06-04 00:00:00.000	1	3.99	1

출처 : http://www.dbguide.net/db.db?cmd=view&boardUid=13815&boardConfigUid=9&categoryUid=216&boardIdx=72&boardStep=1

저작자표시 비영리 변경금지

'DataBase' 카테고리의 다른 글

SELECT * INTO와 INSERT INTO SELECT..의 차이점 (0)	2013.04.19
특정 컬럼명을 사용하는 모든 테이블 검색하는 쿼리 (0)	2013.04.15
XML 문서 가져오기 및 XQuery 쿼리 예제 (0)	2013.02.26
NoSQL은 생각보다 쓸만하지 않다. (0)	2012.09.26
MSSQL 2005 메모리 관리 (0)	2012.08.09

XML 문서 가져오기 및 XQuery 쿼리 예제

중년 플머 김씨 2013. 2. 26. 16:44

2013. 2. 26. 16:44

출처 : http://laigo.kr/723

SQL Server 2012 에서 XML 문서를 테이블에 Bulk Insert 하는 방법과 XQuery 를 사용하여 XML 데이터를 검색하는 몇 가지 예제를 아래와 같이 정리하였습니다.

1. XML 원본 문서를 테이블에 Bulk Insert 하는 방법

CREATE DATABASE XMLDB
GO

USE XMLDB
GO

CREATE TABLE TBL_XML (
ID INT IDENTITY PRIMARY KEY,
XMLDATA XML
)
GO

INSERT INTO TBL_XML(XMLDATA)
SELECT * FROM OPENROWSET (
BULK 'D:\SQL\BOOKS.XML', SINGLE_BLOB) AS x;

2. XQuery 를 사용하여 XML 데이터 검색 예제

CREATE TABLE TBL_XQUERY (
ID INT IDENTITY PRIMARY KEY,
XMLDATA XML
)
GO

INSERT INTO TBL_XQUERY VALUES ('
<CATALOG>
<book id="bk101">
   <author>Gambardella, Matthew</author>
   <title>XML Developer''s Guide</title>
   <genre>Computer</genre>
   <price>44.95</price>
   <publish_date>2000-10-01</publish_date>
   <description>An in-depth look at creating applications with XML.</description>
</book>
</CATALOG>
')

INSERT INTO TBL_XQUERY VALUES ('
<CATALOG>
<book id="bk102">
    <author>Ralls, Kim</author>
    <title>Midnight Rain</title>
    <genre>Fantasy</genre>
    <price>5.95</price>
    <publish_date>2000-12-16</publish_date>
    <description>A former architect battles corporate zombies, n evil sorceress, and her own childhood to become queen of the world.</description>
</book>
</CATALOG>
')

INSERT INTO TBL_XQUERY VALUES ('
<CATALOG>
    <book id="bk103">
    <author>Corets, Eva</author>
    <title>Maeve Ascendant</title>
    <genre>Fantasy</genre>
    <price>5.95</price>
    <publish_date>2000-11-17</publish_date>
    <description>After the collapse of a nanotechnology society in England, the young survivors lay the foundation for a new society.</description>
    </book>
</CATALOG>
')

SELECT XMLDATA.query('/CATALOG/book')
FROM TBL_XQUERY
WHERE ID = 2
/*
<book id="bk102">
<author>Ralls, Kim</author>
<title>Midnight Rain</title>
<genre>Fantasy</genre>
<price>5.95</price>
<publish_date>2000-12-16</publish_date>
<description>A former architect battles corporate zombies, n evil sorceress, and her own childhood to become queen of the world.</description>
</book>
*/

SELECT XMLDATA.value ( '(/CATALOG/book/@id)[1]', 'char(5)' ) AS 'Book id'
FROM TBL_XQUERY
/*
bk101
bk102
bk103
*/

SELECT XMLDATA
FROM TBL_XQUERY
WHERE XMLDATA.exist('/CATALOG/book[@id="bk103"]') = 1
/*
<CATALOG>
<book id="bk103">
    <author>Corets, Eva</author>
    <title>Maeve Ascendant</title>
    <genre>Fantasy</genre>
    <price>5.95</price>
    <publish_date>2000-11-17</publish_date>
    <description>After the collapse of a nanotechnology society in England, the young survivors lay the foundation for a new society.</description>
</book>
</CATALOG>
*/

SELECT
nCol.value('@id', 'char(5)') AS 'Book id',
nCol.value('(author)[1]', 'varchar(10)') AS author,
nCol.value('(title)[1]', 'varchar(50)') AS title,
nCol.value('(genre)[1]', 'varchar(10)') AS genre
FROM TBL_XQUERY
CROSS APPLY XMLDATA.nodes('/CATALOG/book') AS nTbl(nCol)
ORDER BY ID
/*
bk101 Gambardell XML Developer's Guide Computer
bk102 Ralls, Kim Midnight Rain Fantasy
bk103 Corets, Ev Maeve Ascendant Fantasy
*/

[참고자료]

Examples of Bulk Import and Export of XML Documents (SQL Server)
http://msdn.microsoft.com/en-us/library/ms191184.aspx

XQuery 언어 참조(SQL Server)
http://msdn.microsoft.com/ko-kr/library/ms189075.aspx

저작자표시 비영리 변경금지

'DataBase' 카테고리의 다른 글

특정 컬럼명을 사용하는 모든 테이블 검색하는 쿼리 (0)	2013.04.15
MSSQL-XQuery에 대해서... (0)	2013.03.08
NoSQL은 생각보다 쓸만하지 않다. (0)	2012.09.26
MSSQL 2005 메모리 관리 (0)	2012.08.09
MS-SQL 특정 테이블 데이터를 백업/복구 (0)	2012.08.07

NoSQL은 생각보다 쓸만하지 않다.

중년 플머 김씨 2012. 9. 26. 00:21

2012. 9. 26. 00:21

출처 : http://eincs.net/2012/06/nosql-is-not-useful/

NoSQL이라고 일컫는 분산 데이터베이스들이 요즘 트렌드다. 뛰어난 확장성과 가용성으로 각광을 받고 있다. 실제로 여러 소셜게임업체들이 NoSQL을 사용하며, 넷플릭스 또한 NoSQL인 Hbase와 Cassandra를 주요 저장소로 사용[1]한다. 그리고 페이스북의 메신저 시스템[2] 및 실시간 분석 시스템[3] 또한 HBase기반으로 만들어졌다. NoSQL을 사용하면 RDBMS에서의 불편한 것들이 모두 해결되고 높은 확장성을 가진 시스템을 구축할 수 있는 것 같지만 현실은 그렇지 못하다. 대부분의 서비스들은 NoSQL을 제대로 사용하지 못하고 있다.

대부분의 서비스는 RDBMS를 주요 저장소로 사용한다.

아직까지는 구글을 제외한 대부분의 다른 서비스들은 NoSQL을 제대로 사용하고 있지 못하다. 거의 대부분의 기업들은 주요 저장소로 RDBMS를 사용하고 있는 것이다. 대표적으로 몇 가지 사례를 들어보면 다음과 같다.

페이스북은 MySQL을 사용한다.

2012년 3월 기준으로, 페이스북의 MAU는 9억명[4]을 넘었다. 이 정도의 추세라면 2012년 중순에는 10억명을 돌파할 것이라고 한다. 이렇게 엄청난 수의 사용자 트래픽을 감당하기 위해서는 아주 특별한 방법을 통해 데이터를 저장해야 될 것 같지만, 실제로는 MySQL을 사용하여 저장 및 관리[5]한다. 심지어 최근에 적용된 기능인 타임라인도 MySQL을 사용하여 구현[6]되었다. 앞서 언급된 메세징 시스템이나 실시간 분석 시스템 등의 정도만 NoSQL을 이용하여 구현되었고, 대부분은 여전히 RDBMS를 쓰고 있는 것이다.

MySQL을 여러개의 논리적 DB와 여러 대의 물리적 서버에 나누어 운영된다. (Sharding)
데이터는 Key-Value 형태로 최대한 단순하게 저장된다.
각 데이터의 조인 연산은 Web Server에서 담당한다.

트위터도 MySQL을 사용한다.

트위터의 경우, 많이 들어오는 경우 초당 수 천건의 트윗이 들어온다.[7] 올해 초의 슈퍼볼 결승전 때는 초당 트윗이 만건을 넘기기도 하였다.[8] 이렇게 엄청난 양의 트래픽을 처리하는 트위터 또한 주요 저장소로 MySQL을 사용한다. 사실 처음에는 Cassandra로 바꾸려고 했었지만[9] 결국엔 MySQL 시스템을 유지하기로 결정하였다.[10] 트위터는 Gizzard를 통해 데이터 레이어를 추상화 하여 MySQL에 데이터를 저장한다.[11] 이렇게 엄청난 수의 트윗에 대한 아이디를 발급하기 위해 Snowflake를 사용[12]한다.

MySQL을 여러개의 논리적 DB와 여러 대의 물리적 서버에 나누어 운영된다. (Sharding)
Gizzard를 이용하여 데이터의 Sharding과 Replication을 추상화한다.

Tumblr도 아직은 MySQL가 주요 저장소다.

Tumblr는 엄격하게 말하면 블로깅 서비스이지만, 체류시간이 페이스북 다음으로 두번째로 긴 소셜 서비스로 소개된다. (물론 페이스북이 압도적으로 크다) Tumblr에서도 실제 데이터는 MySQL을 사용하여 저장하며, 제한적으로 NoSQL을 사용[13]한다.

MySQL에 데이터를 잘 쪼개 저장한다. (Sharding)
HBase같은 것들은 URL Shorter나 데이터 분석 등 제한적으로 사용되었다.
시간 순서대로 쪼개진 데이터 덕분에 특정 MySQL Shard에 로드가 집중되는건 Master-Slave구성으로 해결하였다.

Pinterest도 MySQL을 주요 저장소로 사용한다.

Pinterest는 특정 주제로 사진을 게시 및 공유 할 수 있는 서비스로, 단기간에 사용자 3000만명을 넘기며, 그것도 80%이상이 여성 사용자를 확보하면서 큰 주목을 받고 있다. Pinterest는 데이터 분석을 위해 Hadoop을 이용[14] 하긴 하지만, 실제 데이터는 MySQL에 저장[15]한다.

MySQL을 이용해 데이터를 저장한다.
다양한 방법으로 데이터를 캐싱한다.

인스타그램도 PostgreSQL을 사용한다.

인스타그램은 1500만명 이상이 사용하는 사진 공유 서비스이다. 그리고 페이스북에 인수되기도 하였다. 인스타그램에서는 RDBMS중 하나인 PostgreSQL을 사용[16]한다. 그리고

3명의 엔지니어가 초기 개발에 참여했다.
12개의 EC2 인스턴스를 이용하여 PostgreSQL을 돌린다.
PostgreSQL 인스턴스들은 오픈소스를 이용해 Master-Replica 형태로 운영된다.
시스템은 그 외 여러가지 오픈 소스를 이용하여 구성되어 있다.

에버노트도 MySQL을 사용한다.

에버노트는 클라우드 노트 서비스이다. 2011년 한해동안 600만명에서 2000만명으로 유저가 증가할 정도로 엄청난 속도로 성장하고 있는 서비스이며[17] 수 많은 노트들을 다양한 채널을 통해 관리할 수 있는 환경을 제공한다. 에버노트는 MySQL을 저장소로 사용하며, NoSQL이 아니라 SQL기반의 RDBMS를 사용하는 이유에 대해서도 블로그[18]에 올라왔었다.

MySQL을 사용한다. [Sharding]
RDBMS를 사용하는 이유는 ACID 때문이다.

이처럼 대규모 트렌젝션을 처리해야하는 서비스도 주요 저장소로 아직은 RDBMS를 사용한다. 페이스북의 메신저 시스템과 실시간 분석 시스템, 텀블러의 주소 길이 단축 시스템 정도만 HBase와 같은 NoSQL을 실험적으로 도입하는 단계이다. NoSQL을 전면적으로 도입하려다 그만 둔 트위터도 있고 심지어 처음부터 잘되어있는걸 가져다 쓰라는 Instagram도 있다. 에버노트는 NoSQL을 쓰지 않는 이유를 명확히 밝혔다. Scalability가 가장 중요한 이슈일 것 같은 많은 서비스들이 아직도 NoSQL을 사용하지 않는 이유는 자명하다.

NoSQL 기술은 아직은 걸음마 단계이다.

오픈소스로 공개되어 있는 NoSQL은 굉장히 많다.[19] 많은 기업들이 NoSQL을 도입하기 위해 여러가지 시도들을 하고 있다. 하지만 아직까지 주요 데이터 저장소로 RDBMS를 사용하는 경우가 거의 대부분인 것이 현실이다. 왜 그럴까? 많은 이유가 있을 수 있겠지만, 그 중 중요한 하나는 배포 중인 NoSQL들이 범용적으로 사용하기에는 아직 부족한점이 너무도 많다는 것이다.

서비스를 구현하는데 반드시 필요한 것들이 있다. 바로 Index와 Transaction이다. 이것들 없이도 어떻게든 잘 구현할 수 있는 특수목적의 시스템을 제외하면 이런 기능들은 제대로된 서비스를 만들기 위해서 반드시 필요하다. 이런 기능들이 제공되지 않으면 범용적인 사용이 불가능하며, 충분히 추상화되지 못한 상태에서 Concrete한 문제를 해결하기 위해 쓸데없는 시간을 보낼 것이다. 현재 배포되어 있는 NoSQL들은 이와 같은 기능이 아예 없거나 제한적이다. Transaction의 경우 NoSQL상에서 분산 트렌젝션을 구현하기 위한 Transaction을 구현하기 위한 시도 들이 있었다. 그것들이 바로 Elastras[20]와 CloudTPS[21]이다. 하지만 Eventually Constsitancy의 한계를 보여주며 완벽하게 망했다.

사실 HBase에는 TransactionalTable[22] 같은 트렌젝션을 제공하기 위한 API가 존재하기는 한다. 하지만 글쎄, 2011년 초에 사용하려고 써봤지만, 그닥 제대로 동작하는 것 같진 않았다.

단, 구글을 제외하고

Transaction과 관련하여 구글이 2010년에 논문을 내놓았다. Percolator[23]인데 BigTable구조의 스토어에서 분산트렌젝션을 구현하는 방법에 대해 기술해 놓았다. 아주 깔끔 명료하고 완벽하게 동작한다. 이미 구글에서 사용하는 시스템이다. 어떤 대학의 연구실에선 자기들이 독자적으로 개발한 분산트렌젝션 방법이 살짝 부족하긴 해도 알고봤더니 구글의 Percolator와 비슷한 방법이라고 자랑질[24]을 할 정도이니 더 이상 언급하지 않아도 될 것 같다. 그리고 이미 구글의 클라우드 서비스인 AppEngine에서는 BigTable을 기본 데이터 저장소로 사용할 수 있도록 해주며, Indexing과 Transaction을 완벽하게 제공한다. 너무 비싸긴 하지만.

결론

거의 대부분의 서비스에서는 NoSQL을 사용하지 않는다. 그리고 그 이유는 트렌젝션과 같은 일반적인 서비스 구현에 필요한 기능들이 전혀 준비되어 있지 않기 때문이다. 하지만 구글의 경우 모든 것을 해결한 시스템을 BigTable상에 구현했으며 이미 몇 년동안 서비스하고 있다. 내리고 싶은 결론은 두 가지다.

구글을 찬양하자.
바퀴를 만들지 말자.

서비스를 구현하는데 주된 데이터 저장소로 NoSQL 사용을 고려하고 있다면, 구글을 제외한 다른 업체에서 일반적인 서비스를 구현하는데 있어서 NoSQL을 주된 저장소로 사용하고 있지 않다는 사실을 알고 결정하자. 사실 현재 일하고 있는 VCNC에서 Between이라는 서비스를 돌리고 있는데, 주저장소로 HBase를 쓰고 있기는 하다.

[1] http://techblog.netflix.com/2011/01/nosql-at-netflix.html
[2] https://www.facebook.com/note.php?note_id=454991608919
[3] http://borthakur.com/ftp/RealtimeHadoopSigmod2011.pdf
[4] http://newsroom.fb.com/content/default.aspx?NewsAreaId=22
[5] http://www.infoq.com/presentations/Facebook-Software-Stack
[6] https://www.facebook.com/notes/facebook-engineering/building-timeline-scaling-up-to-hold-your-life-story/10150468255628920
[7] http://yearinreview.twitter.com/en/tps.html
[8] http://blog.twitter.com/2012/02/post-bowl-twitter-analysis.html
[9] http://nosql.mypopescu.com/post/407159447/cassandra-twitter-an-interview-with-ryan-king
[10] http://engineering.twitter.com/2010/07/cassandra-at-twitter-today.html
[11] http://highscalability.com/blog/2011/12/19/how-twitter-stores-250-million-tweets-a-day-using-mysql.html
[12] http://engineering.twitter.com/2010/06/announcing-snowflake.html
[13] http://highscalability.com/blog/2012/2/13/tumblr-architecture-15-billion-page-views-a-month-and-harder.html
[14] http://highscalability.com/blog/2012/5/21/pinterest-architecture-update-18-million-visitors-10x-growth.html
[15] http://highscalability.com/blog/2012/2/16/a-short-on-the-pinterest-stack-for-handling-3-million-users.html
[16] http://instagram-engineering.tumblr.com/post/13649370142/what-powers-instagram-hundreds-of-instances-dozens-of
[17] http://gigaom.com/2011/12/27/evernote-2011-growth-users/
[18] http://blog.evernote.com/tech/2012/02/23/whysql/
[19] http://nosql-database.org
[20] http://www.usenix.org/event/hotcloud09/tech/full_papers/das.pdf
[21] http://www.globule.org/publi/CSTWAC_tsc2011.html
[22] http://archive.apache.org/dist/hadoop/hbase/hbase-0.20.1/docs/api/org/apache/hadoop/hbase/client/transactional/TransactionalTable.html
[23] http://research.google.com/pubs/pub36726.html
[24] http://www.math.uwaterloo.ca/~hdesterc/websiteW/Data/presentations/pres2010/NIISI.pptx.pdf

Filed Under: developmentTagged With: Distributed System, NoSQL, RDBMS

출처 : http://eincs.net/2012/06/nosql-is-not-useful/

저작자표시 비영리 변경금지

'DataBase' 카테고리의 다른 글

MSSQL-XQuery에 대해서... (0)	2013.03.08
XML 문서 가져오기 및 XQuery 쿼리 예제 (0)	2013.02.26
MSSQL 2005 메모리 관리 (0)	2012.08.09
MS-SQL 특정 테이블 데이터를 백업/복구 (0)	2012.08.07
ASP.NET 페이지에서 갑자기 MS-SQL 접속이 안될때 (ADO 접속에러) (0)	2012.04.27

MSSQL 2005 메모리 관리

중년 플머 김씨 2012. 8. 9. 19:33

2012. 8. 9. 19:33

태국에 게임 서버 서비스를 하려고 이것 저것 테스트 하던 도중

이상하게 쿼리를 한번에 3만개 정도 실행 시키면, 데드락 걸리면서 쿼리가 제대로 실행이 안되는 경우가 발생했습니다.

처음엔 이게 시간과 관련된 쿼리라 태국의 로컬시간대랑 뭔가 연관이 있지 않을까 이것 저것 보던중

태국에서 셋팅한 윈도우 설정에 문제가 있다는걸 확인했습니다.

CPU가 Xeon X5675 @ 3.07Ghz 에다가 16GB 렘이 있는 시스템인데

윈도우 2003 (32bit)를 설치해서 메모리를 제대로 소화를 못하는거 같더군요.

그런 고로, 메모리를 설정하는 것을 구글에서 찾아내서 적용시켜 보니 쌩쌩 날아다니는 DB....

ㅁㄴㅀㄴㅏㅣㅓㅈㅎㅁ5!@$

어쨋든.... 메모리 설정에 대해선

http://toe10.tistory.com/63 을 참고해서 셋팅했습니다.

혹시 모를 폭파 위험에 여기서 제가 한 셋팅 순서도 올려 놓겠습니다.

1. MSSQL에서 AWE(Address Windowing Extensions)을 설정해야 합니다만,

32bit 운영체제 이므로 그전에 Lock page in memory 권한을 얻어와야 합니다.

시작 -> 프로그램 -> 관리도구 -> 서비스에서

SQL Server Agent(MSSQLSERVER)의 사용자 명을 확인합니다.

2. 시작 -> 실행 -> gpedit.msc 를 실행한뒤 아래 그림처럼

Lock pages in memory 권한을 1과 같은 사용자에게 줍니다.

3. 서버 설정 탭에 들어와서 AWE 사용을 체크하고

최대 서버 메모리를 설정합니다 (단위는 MB)

4. 네트워크 속성에서 네트워크 응용 프로그램을 취해 데이터 처리량 최대화를 선택합니다.

...

문제는 "Microsoft SQL Server 2005 포켓 컨설턴트 관리자용"이란 책에선 이 옵션을 피하라고 기술 되어있습니다만..

음....

저작자표시 비영리 변경금지

'DataBase' 카테고리의 다른 글

XML 문서 가져오기 및 XQuery 쿼리 예제 (0)	2013.02.26
NoSQL은 생각보다 쓸만하지 않다. (0)	2012.09.26
MS-SQL 특정 테이블 데이터를 백업/복구 (0)	2012.08.07
ASP.NET 페이지에서 갑자기 MS-SQL 접속이 안될때 (ADO 접속에러) (0)	2012.04.27
MS-SQL ldf 파일 사이즈 줄이는방법! (0)	2012.04.26

MS-SQL 특정 테이블 데이터를 백업/복구

중년 플머 김씨 2012. 8. 7. 12:40

2012. 8. 7. 12:40

특정 테이블의 레코드들만 따로 백업할때 쓰는 방법 입니다.

(보안상 중요한 텍스트는 다 삭제)

command 에 들어가서

백업

$> bcp [db명].dbo.[백업할 테이블명] out [백업 파일명] -c /U[db의 유저명] /P[db의 암호]

복구

$> bcp [db명].dbo.[백업할 테이블명] in [백업 파일명] -c /U[db의 유저명] /P[db의 암호]

저작자표시 비영리 변경금지

'DataBase' 카테고리의 다른 글

NoSQL은 생각보다 쓸만하지 않다. (0)	2012.09.26
MSSQL 2005 메모리 관리 (0)	2012.08.09
ASP.NET 페이지에서 갑자기 MS-SQL 접속이 안될때 (ADO 접속에러) (0)	2012.04.27
MS-SQL ldf 파일 사이즈 줄이는방법! (0)	2012.04.26
MS-SQL : restore database is terminating abnormally 뜰때 (0)	2012.04.25

PREV 이전 1 2 3 4 5 NEXT 다음

기억창고

DataBase

MSSQL-XQuery에 대해서...

XQuery 지원기능

XQuery 구문

FLOWR 문장

XQuery 표현식 사용예제

단순한 XQuery 표현식 사용

XQuery 조건 사용

For 문장과 Return 문장 사용

For 문장과 Return 문장을 사용하여 XML 생성

For 문장과 Return 문장을 사용하여 속성과 값을 반환

For, Where, Return 문장 사용

머리글에 네임스페이스 지정

기본 네임스페이스 사용

XML 데이터형에서 제공하는 메서드를 사용하여 쿼리실행

Query 메서드

Value 메서드

Exist 메서드

관계형 테이블의 컬럼과 변수의 바인딩

Modify 메서드를 사용하여 XML 데이터 변경

INSERT 문장

replace 문장

DELETE 문장

Nodes 메서드를 사용하여 XML 데이터 부분추출

XML 변수에 대해 nodes 메서드 사용법

XML 컬럼에 대해 nodes 메서드 사용하는 방법

'DataBase' 카테고리의 다른 글

XML 문서 가져오기 및 XQuery 쿼리 예제

'DataBase' 카테고리의 다른 글

NoSQL은 생각보다 쓸만하지 않다.

대부분의 서비스는 RDBMS를 주요 저장소로 사용한다.

페이스북은 MySQL을 사용한다.

트위터도 MySQL을 사용한다.

Tumblr도 아직은 MySQL가 주요 저장소다.

Pinterest도 MySQL을 주요 저장소로 사용한다.

인스타그램도 PostgreSQL을 사용한다.

에버노트도 MySQL을 사용한다.

NoSQL 기술은 아직은 걸음마 단계이다.

단, 구글을 제외하고

결론

'DataBase' 카테고리의 다른 글

MSSQL 2005 메모리 관리

'DataBase' 카테고리의 다른 글

MS-SQL 특정 테이블 데이터를 백업/복구

'DataBase' 카테고리의 다른 글

+ Recent posts

티스토리툴바