Geny C4A i C4B obsahují shodně 41 exonů lišící se v několika nukleotidech a kódující transkript pro prekurzorový protein C4 o 1744 aminokyselinových zbytcích (Yu, 1991). Tento jednořetězcový prekurzor (Mr 200 000) je následnými posttranslačními úpravami přeměněn na trojřetězcovou molekulu C4 účastnící se vlastní komplementové kaskády (Hall and Colten, 1977). Tři řetězce (alfa, beta a gama) proteinu C4 jsou na molekule DNA prekurzoru C4 uspořádané v pořadí beta-alfa-gama. Místa štěpení mezi těmito řetězci jsou kódovány sekvencemi nacházejcími se v exonu 16 (pro řetězce beta-alfa) a v exonu 33 (pro řetězce alfa-gama) (Yu,1991).
Řetězec beta je tvořený 656 aminokyselinovými zbytky a je kódovaný exony 1 až 16. Obsahuje nejrozsáhlejší intron genu C4 (intron 9) dlouhý 6 – 7 kb (Yu, 1991) vyskytující se ve většině prvních lokusů (většinou kódujících C4A), ale pouze v některých druhých lokusech (většinou kódujících C4B) (Yu and Campbell, 1987).
Řetězec alfa sestává ze 770 aminokyselin a je kódovaný exony 16 až 33. Obsahuje sekvence kódující dvě významné složky komplementové kaskády. První složkou je anafylatoxin C4a. Ten je kódovaný částí exonu 16 (11 aminokyselin) a celým exonem 17 (66 aminokyselin). Místem štěpení je arginin na pozici 737, na který se váže jednotka C1s komplementové kaskády zajišťující aktivaci proteinu C4 (rozštěpením proteinu na složky C4a a C4b). Druhou významnou složkou komplementové kaskády je fragment C4d, který je kódovaný exony 23 až 30. Za vyštěpení tohoto fragmentu v procesu deaktivace složky C4b je odpovědný faktor I. Na fragmentu C4d se nachází velmi důležité antigenní determinanty Rodgers a Chido, dále pak isotypové, polymorfní a thioesterové aminokyselinové zbytky determinující isotypy C4A a C4B (Yu, 1991).
Řetězec gama je tvořený 291 aminokyselinami a kódovaný 9 exony (exony 33 až 41). Obsahuje druhý největší intron (dlouhý 1494 bp). Oproti řetězcům alfa a beta je konzervativnější. Zatím u něj nebyla popsána žádná specifická funkce (Yu, 1991).
2. 1. 1. Polymorfismus genů C4A a C4B
Jak bylo uvedeno, C4A a C4B jsou lokusy genu C4 kódující dvě isotypové formy proteinu C4, který se účastní komplementové kaskády. Díky nukleotidovým (tím i aminokyselinovým) substitucím nebo delecím se oba isotypy vyskytují celkem v 41 variantě. U bělošské populace je nejrozšířenější alelou genu C4A alela C4A3 (85 %) a nejrozšířenější alelou genu C4B je alela C4B1 (86 %) (Blanchong et al., 2000; Yang et al., 2003).
Jednotlivé nukleotidové substituce se projevují rozdílnou elektroforetickou mobilitou, hemolytickou aktivitou, chemickou reaktivitou a antigenními determinantami příslušných variant genu C4 (Tab. 2) (Law et al., 1984).
Tab. 2. Srovnání lidských proteinů C4A a C4B (Yu et al., 1988).
|
C4A
|
C4B
|
1. Elektroforetická mobilita
(a) agarózový gel
(b) SDS-PAGE (řetězec α)
2. Thioesterová reaktivita
(a) hemolytická aktivita
(b) afinita kovalentní vazby
(i) amino-skupina
(ii) hydroxylová skupina
3. Antigenní determinanty*
(antigen krevní skupiny)
|
rychlá
Mr 96 000
nižší
vyšší
nižší
Rodgers
(Rg: 1, 2)
|
pomalá
Mr 94 000
vyšší
nižší
vyšší
Chido
(Ch: 1, 2, 3, 4, 5, 6)
|
* s výjimkou C4A1 a C4B5
|
|
|
Protein C4A je oproti proteinu C4B elektroforeticky pohyblivější. Liší se i molekulovou hmotností řetězců alfa. Pomocí elektroforézy v polyakrylamidovém gelu (SDS-PAGE) byla naměřena molekulová hmotnost (Mr) řetězce alfa proteinu C4A 96 000, u proteinu C4B byla o 2 000 menší (Roos et al., 1982).
Vyšší hemolytickou aktivitu vykazuje protein C4A, což bylo potvrzeno v haplotypech obsahujících nulové alely C4A (C4AQ0) a C4B (C4BQ0), kdy v přítomnosti C4AQ0 byla celková hemolytická aktivita 2× – 3× nižší než v přítomnosti C4BQ0 (Law et al., 1984). Později bylo prokázáno, že snížená hemolytická aktivita nemusí být podmíněna pouze nulovými alelami, ale mohou ji způsobit i mnohem jemnější změny, jakými jsou záměny 1 nukleotidu. Na základě přítomnosti defektní C5 konvertázy byla prokázána nízká nebo téměř žádná hemolytická aktivita u obou isotypů daná substitucí jediné aminokyseliny v řetězci beta proteinu C4. V případě genu C4A byla substituce prokázána u alely C4A6, kdy arginin na pozici 458 byl nahrazen tryptofanem (Anderson et al., 1992). U genu C4B byl pokles hemolytické aktivity zapříčiněn substitucí prolinu za leucin na pozici 459 (McLean et al., 1994).
Rozdílná chemická reaktivita isotypů je dána specifickou sekvencí aminokyselin na řetězci alfa (v oblasti C4d) na pozicích 1101-1106. U C4A se vyskytuje sekvence Pro-Cys-Pro-Val-Leu-Asp (PCPVLD) zajišťující vyšší afinitu aktivované molekuly C4 k peptidovým antigenům obsahujícím aminoskupiny. Naproti tomu u isotypu C4B se vyskytuje sekvence Leu-Ser-Pro-Val-Ile-His (LSPVIH), která způsobuje vyšší afinitu k antigenům s hydroxylovými skupinami sacharidů (Law et al., 1984; Yu et al., 1986).
Kromě již zmíněné rozdílné elektroforetické mobility, hemolytické aktivity a odlišné chemické reaktivity, se isotypy C4A a C4B liší i ve čtyřech dalších aminokyselinách v oblasti řetězce kódujícího C4d fragment. Tyto aminokyseliny, spolu se substitucemi na pozicích 1101-1106, vytvářejí 8 různých epitopů pro antigenní determinanty krevních skupin Rodgers (Rg1 a Rg2) a Chido (Ch1 až Ch6) (Obr. 2). U isotypu C4A se kyselina asparagová objevuje na pozici 1054, asparagin (Rg2) na pozici 1157 a valin a leucin na pozicích 1188 a 1191 (Rg1), zatímco u isotypu C4B je na stejných pozicích glycin (1054), serin (1057; Ch6) a alanin a arginin (1188 a 1191; Ch1). Ve většině případů se epitop Rg vyskytuje u molekul C4A a epitop Ch u C4B. Výjimku představují alotyp C4A1, který je spojený s epitopy Ch1, 2, 5, 6 a alotyp C4B5 spojený s epitopy Rg1 a Rg2. U nízkého procenta populace se objevuje varianta epitopů Rg1 a Ch6 v jedné molekule C4 označovaná WH (Yu et al., 1988).
Obr. 2. Strukturní model popisující všechny sérologicky definované antigeny Rg a Ch založené na známých aminokyselinových rozdílech v exonech 25 – 28 genů C4A a C4B (Schneider et al., 1996, upraveno).
Kromě 8 zmiňovaných polymorfních míst se v sekvenci genu C4 nachází dalších 23 polymorfních míst odhalených nukleotidovou nebo proteinovou sekvenací (Tab. 3, Obr. 3). Nejvíc polymorfních míst bylo objeveno v řetězci alfa (24), a to v oblasti kódující fragment C4d (19 včetně 8 již popisovaných), v řetězci beta bylo detekováno 6 polymorfních míst a pouze jediné polymorfní místo v řetězci gama (Yu, 1991; Blanchong et al., 2001).
Tab. 3. Polymorfismus lidských komplementových proteinů C4A a C4B a kódující sekvence (Blanchong et al., 2001).
|
|
|
|
alotyp
|
|
exon
|
AMK
substituce
|
nt
sekvence
|
A3a
|
A4
|
A6
|
A3b
|
A13
|
A1-Ch1
|
B-dlouhý
|
B-krátký
|
B1-SC01
|
B2
|
B1a
|
B1b
|
B12
|
B3
|
B5-Rg1
|
B1-hi
|
řetězec beta (1 – 656)
|
|
2
|
F63
|
TTC/TTT
|
C
|
C
|
T
|
|
|
|
C
|
C
|
C
|
|
|
|
|
|
|
|
|
9
|
Y328S
|
TAT/TCT
|
A
|
C
|
A
|
|
|
|
A
|
C
|
C
|
C
|
C
|
C
|
|
|
C
|
|
|
11
|
V399A
|
GTC/GCC
|
T
|
C
|
T
|
|
|
|
T
|
T
|
T
|
T
|
|
|
|
|
|
|
|
12
|
R458W
|
CGG/TGG
|
C
|
C
|
T
|
|
|
|
C
|
C
|
C
|
C
|
|
|
|
|
|
C
|
|
12
|
P459L
|
CGG/CTG
|
G
|
G
|
G
|
G
|
|
|
G
|
G
|
G
|
G
|
|
|
|
|
|
T
|
řetězec alfa (661 1427); C4d (938 – 1327)
|
C4a
|
17
|
L707P
|
CTG/CCG
|
T
|
C
|
C
|
|
|
|
C
|
C
|
C
|
C
|
|
|
|
|
|
|
|
20
|
V806
|
GTC/GTT
|
C
|
C
|
C
|
|
|
|
C
|
T
|
T
|
C
|
|
|
|
|
|
|
|
21
|
G863
|
GGG/GGT
|
G
|
G
|
G
|
|
|
|
G
|
G
|
T
|
G
|
|
|
|
|
|
|
|
21
|
A888T
|
GCC/ACC
|
G
|
G
|
G
|
|
|
|
G
|
A
|
A
|
G
|
|
|
|
|
|
|
|
24
|
L1018
|
CTG/CTT
|
G
|
G
|
G
|
|
|
|
G
|
G
|
T
|
G
|
|
|
|
|
|
|
Ch5/Ch5
|
25
|
D1054G
|
GAC/GGC
|
A
|
A
|
A
|
A
|
A
|
G
|
G
|
G
|
G
|
A
|
G
|
G
|
G
|
G
|
A
|
|
|
26
|
G1076
|
GGC/GGA
|
C
|
C
|
C
|
C
|
C
|
A
|
A
|
C
|
C
|
C
|
C
|
C
|
A
|
C
|
C
|
|
C4A/C4B
|
26
|
P1101L
|
CCC/CTC
|
C
|
C
|
C
|
C
|
C
|
C
|
T
|
T
|
T
|
T
|
T
|
T
|
T
|
T
|
T
|
|
C4A/C4B
|
26
|
C1102S
|
TGT/TCT
|
G
|
G
|
G
|
G
|
G
|
G
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
|
C4A/C4B
|
26
|
L1105I
|
TTA/ATA
|
T
|
T
|
T
|
T
|
T
|
T
|
A
|
A
|
A
|
A
|
A
|
A
|
A
|
A
|
A
|
|
C4A/C4B
|
26
|
D1106H
|
GAC/CAT
|
G-C
|
G-C
|
G-C
|
G-C
|
G-C
|
G-C
|
C-T
|
C-T
|
C-T
|
C-T
|
C-T
|
C-T
|
C-T
|
C-T
|
C-T
|
|
Ch6/Ch6
|
28
|
N1157S
|
AAC/AGC
|
A
|
A
|
A
|
A
|
A
|
G
|
G
|
G
|
G
|
G
|
A
|
G
|
G
|
G
|
G
|
|
|
28
|
T1182S
|
ACA/ATA
|
C
|
T
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
|
Rg1/Ch1
|
28
|
A1186
|
GCG/GCC
|
G
|
G
|
G
|
G
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
G
|
|
Rg1/Ch1
|
28
|
V1188A
|
GTG/GCG
|
T
|
T
|
T
|
T
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
C
|
T
|
|
Rg1/Ch1
|
28
|
L1191R
|
CTC/CGG
|
TC
|
TC
|
TC
|
TC
|
GG
|
GG
|
GG
|
GG
|
GG
|
GG
|
GG
|
GG
|
GG
|
GG
|
TC
|
|
|
29
|
P1226
|
CCG/CCA
|
G
|
G
|
G
|
G
|
|
G
|
G
|
G
|
G
|
G
|
G
|
G
|
|
A
|
G
|
|
|
29
|
A1267S
|
GCG/TCG
|
G
|
T
|
G
|
T
|
|
G
|
G
|
G
|
G
|
G
|
G
|
G
|
|
G
|
G
|
|
|
30
|
I1298F
|
ATT/TTT
|
A
|
A
|
A
|
A
|
|
|
A
|
A
|
T
|
A
|
|
|
|
|
|
|
řetězec gama (1432 – 1722)
|
|
34
|
D1478Y
|
GAC/TAC
|
G
|
G
|
G
|
G
|
|
|
G
|
G
|
G
|
T
|
|
|
|
|
|
|
Polymorfní AMK detekované proteinovou sekvenací nashromážděného séra
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
řetězec β
|
15
|
C616S
|
TGT
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
řetězec α
C4a
|
17
|
D708N
|
GAC
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
řetězec α
C4d
|
28
|
S1090I
|
TCC
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
řetězec α
C4d
|
29
|
R1281V
|
CCG
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
řetězec α
C4d
|
30
|
T1286G
|
ACG
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
řetězec α
C4d
|
30
|
V1287G
|
GTG
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Obr. 3. Strukturní podstata polymorfismu lidských proteinů C4A a C4B. Na proteinech C4A a C4B bylo odhaleno 24 polymorfních aminokyselinových zbytků. C4A a C4B isotypová rezidua na pozicích 1101-1106 jsou vyznačena červeně a modře. Ostatní aminokyseliny zahrnující Rg a Ch antigenní determinanty jsou značené růžově a zeleně. Většina polymorfních míst se nachází v C-koncové oblasti thioesterového místa v oblasti C4d (Blanchong et al., 2001, upraveno).
|