FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6210, 250 aa 1>>>pF1KE6210 250 - 250 aa - 250 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7365+/-0.000759; mu= 12.1016+/- 0.046 mean_var=74.1292+/-14.841, 0's: 0 Z-trim(109.4): 49 B-trim: 0 in 0/54 Lambda= 0.148963 statistics sampled from 10827 (10876) to 10827 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.334), width: 16 Scan time: 1.640 The best scores are: opt bits E(32554) CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 1695 373.2 9.2e-104 CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 955 214.2 7e-56 CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 943 211.6 4.1e-55 CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 940 211.0 6.6e-55 CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 932 209.2 2.1e-54 CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 363 87.0 1.4e-17 CCDS4765.1 DPB1 gene_id:3115|Hs108|chr6 ( 258) 273 67.6 9.3e-12 CCDS78128.1 DQB2 gene_id:3120|Hs108|chr6 ( 264) 262 65.3 4.9e-11 CCDS56419.1 DQB2 gene_id:3120|Hs108|chr6 ( 227) 258 64.4 7.8e-11 >>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa) initn: 1695 init1: 1695 opt: 1695 Z-score: 1976.4 bits: 373.2 E(32554): 9.2e-104 Smith-Waterman score: 1695; 100.0% identity (100.0% similar) in 250 aa overlap (1-250:1-250) 10 20 30 40 50 60 pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII 190 200 210 220 230 240 250 pF1KE6 MGTYVSSVPR :::::::::: CCDS47 MGTYVSSVPR 250 >>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa) initn: 962 init1: 940 opt: 955 Z-score: 1116.8 bits: 214.2 E(32554): 7e-56 Smith-Waterman score: 955; 56.6% identity (79.3% similar) in 242 aa overlap (1-242:1-242) 10 20 30 40 50 60 pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV : : .:.:: .: :..:: . :::..: : .:: :: :::.::::: .. : : CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK ::...:..:: :::. :. :::::.: ..:. : .:.:...: : . : : :.:::. : CCDS47 DLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV : : ::::: :::.::::::::.::::: :::.:::::..::: :. :: : :. :: :. CCDS47 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKISYLTFL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII :::...:::.::::::: :::.::: ..: : . ::.::::::..::.:..::::.:: CCDS47 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFII 190 200 210 220 230 240 250 pF1KE6 MGTYVSSVPR .: CCDS47 QGLRSVGASRHQGPL 250 >>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa) initn: 1000 init1: 887 opt: 943 Z-score: 1102.9 bits: 211.6 E(32554): 4.1e-55 Smith-Waterman score: 943; 54.7% identity (78.9% similar) in 247 aa overlap (1-247:1-246) 10 20 30 40 50 60 pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV ::. . :::: . .:.: ::. : : .:. :: . ::.: .:: ...: : CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHV-IIQAEFYLNPDQSGEFMFDFDGDEIFHV 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK :. :.:.:::: ::: :: :. ::.::.::. ::.:.:...::: . ::::.:::: . CCDS47 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV : ::: .::.:::..:.. :::.:.::::::. :: ::..: : . ::::::::::::. CCDS47 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE6 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII ::.::::::.::::::: :::.:::...: : :.. :..::::::..::::...::..:: CCDS47 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII 180 190 200 210 220 230 250 pF1KE6 MGTYVSSVPR : :. CCDS47 KGLRKSNAAERRGPL 240 250 >>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa) initn: 935 init1: 879 opt: 940 Z-score: 1099.2 bits: 211.0 E(32554): 6.6e-55 Smith-Waterman score: 940; 56.5% identity (79.0% similar) in 248 aa overlap (3-250:10-255) 10 20 30 40 50 pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFD .:: ..: .: ::: . ::: ::::...:. :: :.. .:.: ::: CCDS47 MRPEDRMFHIRA-VILRALSLAFLLSLRGAGAIKADHVSTYA-AFVQTHRPTGEFMFEFD 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 EEQLFSVDLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPP :...: ::: :.:.::.: :::. :. :::::.:: .. .:. :..:::...: : :: CCDS47 EDEMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 RVTVLPKSRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRK .:::.:: ::::::: ::: .:..::::.:.::: ::. ::::::.. : . :. :.: CCDS47 EVTVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHK 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 FHYLPFVPSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFL :::: ::::::: :::.::::::: :::.::: : :: :.. ::..:::::..::::.. CCDS47 FHYLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGII 180 190 200 210 220 230 240 250 pF1KE6 VGTVLIIMGTYVSSVPR ::::::: . . :: CCDS47 VGTVLIIKSLRSGHDPRAQGTL 240 250 260 >>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa) initn: 940 init1: 917 opt: 932 Z-score: 1090.1 bits: 209.2 E(32554): 2.1e-54 Smith-Waterman score: 932; 55.8% identity (78.9% similar) in 242 aa overlap (1-242:1-242) 10 20 30 40 50 60 pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV : : .:.:: .: ...:: . :::..::: ::::.: :::.::::: .. : : CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDGDEEFYV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK ::. .:.::.:: :. : ::::..: ..:. : :......:: . : : :.:::. : CCDS47 DLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPEVTVFSK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV : ::::: :::.::::::::.::::: ::..:::::..::: :. :: : :. :: :. CCDS47 FPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTFL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII :::...:::.::::::: :::.::: ..: : . :::::::::..::.:..::::.:: CCDS47 PSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVVGTVFII 190 200 210 220 230 240 250 pF1KE6 MGTYVSSVPR .: CCDS47 QGLRSVGASRHQGLL 250 >>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa) initn: 262 init1: 102 opt: 363 Z-score: 429.0 bits: 87.0 E(32554): 1.4e-17 Smith-Waterman score: 363; 32.2% identity (63.0% similar) in 211 aa overlap (38-240:49-252) 10 20 30 40 50 60 pF1KE6 VLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSVDLKKSEA . :. . : ... .::.::: :.... CCDS47 WLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLSEAYDEDQLFFFDFSQNTR 20 30 40 50 60 70 70 80 90 100 110 120 pF1KE6 VWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVP-----PRVTVLPKSR : :::::.:.:. :: .: : . .... . . ..: : . :. . CCDS47 VPRLPEFADWAQ--EQGDAPAILFDKEFCEWMIQQIGPKLDGKIPVSRGFPIAEVFTLKP 80 90 100 110 120 130 130 140 150 160 170 180 pF1KE6 VELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHL-FRKFHYLPFVP .:.:.:: :.:.:.:.:::.....: ... : :: . : : : : : :. : :: :.: CCDS47 LEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPV-EGFGPT-FVSAVDGLSFQAFSYLNFTP 140 150 160 170 180 190 190 200 210 220 230 pF1KE6 SAEDVYDCQVEHWGLDAPLLRHWELQVP--IPPPDAMETLVCALGLAIGLVGFLVGTVLI :...: : : . .: :: : : .:...:......:..:..:: ::: CCDS47 EPSDIFSCIVTHEIDRYTAIAYW---VPRNALPSDLLENVLCGVAFGLGVLGIIVGIVLI 200 210 220 230 240 250 240 250 pF1KE6 IMGTYVSSVPR : CCDS47 IYFRKPCSGD 260 >>CCDS4765.1 DPB1 gene_id:3115|Hs108|chr6 (258 aa) initn: 323 init1: 253 opt: 273 Z-score: 324.6 bits: 67.6 E(32554): 9.3e-12 Smith-Waterman score: 273; 35.9% identity (64.1% similar) in 128 aa overlap (111-238:122-246) 90 100 110 120 130 140 pF1KE6 DPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPKSRVELGQPNILICIVDNIFP : :::.: :... : . :.:.: : ...: CCDS47 KDILEEKRAVPDRMCRHNYELGGPMTLQRRVQPRVNVSPSKKGPLQHHNLLVCHVTDFYP 100 110 120 130 140 150 150 160 170 180 190 200 pF1KE6 PVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFVPSAEDVYDCQVEHWGLDAPL :.. :. ::: : ::..:.. . : :. . .: ..:. ::: ::::: .::.:. CCDS47 GSIQVRWFLNGQEETAGVVSTNLIRNGDWTFQILVMLEMTPQQGDVYTCQVEHTSLDSPV 160 170 180 190 200 210 210 220 230 240 250 pF1KE6 LRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLIIMGTYVSSVPR .:. : .::. : :...::. :: . CCDS47 TVEWKAQ---SDSARSKTLTGAGGFVLGLIICGVGIFMHRRSKKVQRGSA 220 230 240 250 >>CCDS78128.1 DQB2 gene_id:3120|Hs108|chr6 (264 aa) initn: 184 init1: 146 opt: 262 Z-score: 311.6 bits: 65.3 E(32554): 4.9e-11 Smith-Waterman score: 266; 26.7% identity (56.4% similar) in 243 aa overlap (14-245:18-246) 10 20 30 40 50 pF1KE6 MALRAGLVLGFHTLMTLLSP-QEAGATKADHMGSYGPAFYQSYGAS-----GQFTH :. : .: :: : . .. : . :. ... . CCDS78 MALQIPGGFWAAAVTVMLVMLSTPVAEARDFPKDFLVQFKGMCYFTNGTERVRGVARYIY 10 20 30 40 50 60 60 70 80 90 100 pF1KE6 EFDEEQLFSVDLKKSEAVWRL----PEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRS . .: :. :. . .:: .: ..... : : :.. . : :.. . CCDS78 NREEYGRFDSDVGEFQAVTELGRSIEDWNNYKDFLEQER-AAVDKVCRHNYEAELRTTLQ 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 RAINVPPRVTVLPKSRVE-LGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYS : .: : ::. : ::.: :.. :.:.: : ...: :.. :.:: : : ::..::. CCDS78 R--QVEPTVTISP-SRTEALNHHNLLVCSVTDFYPAQIKVRWFRNDQEETAGVVSTSLIR 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE6 QPDHLFRKFHYLPFVPSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGL . : :. . .: ..:. :.: ::::: .:..:. .:. : .:. .. ..: CCDS78 NGDWTFQILVMLEITPQRGDIYTCQVEHPSLQSPITVEWRAQ----SESAQSKMLSGIG- 180 190 200 210 220 230 230 240 250 pF1KE6 AIGLVGFLVGTVLIIMGTYVSSVPR ::..: ... .: . CCDS78 -----GFVLGLIFLGLGLIIRHRGQKGPRGPPPAGLLH 240 250 260 >>CCDS56419.1 DQB2 gene_id:3120|Hs108|chr6 (227 aa) initn: 177 init1: 141 opt: 258 Z-score: 308.0 bits: 64.4 E(32554): 7.8e-11 Smith-Waterman score: 258; 29.1% identity (56.8% similar) in 213 aa overlap (14-215:18-223) 10 20 30 40 50 pF1KE6 MALRAGLVLGFHTLMTLLSP-QEAGATKADHMGSYGPAFYQSYGAS-----GQFTH :. : .: :: : . .. : . :. ... . CCDS56 MALQIPGGFWAAAVTVMLVMLSTPVAEARDFPKDFLVQFKGMCYFTNGTERVRGVARYIY 10 20 30 40 50 60 60 70 80 90 100 pF1KE6 EFDEEQLFSVDLKKSEAVWRL----PEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRS . .: :. :. . .:: .: ..... : : :.. . : :.. . CCDS56 NREEYGRFDSDVGEFQAVTELGRSIEDWNNYKDFLEQER-AAVDKVCRHNYEAELRTTLQ 70 80 90 100 110 110 120 130 140 150 160 pF1KE6 RAINVPPRVTVLPKSRVE-LGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYS : .: : ::. : ::.: :.. :.:.: : ...: :.. :.:: : : ::..::. CCDS56 R--QVEPTVTISP-SRTEALNHHNLLVCSVTDFYPAQIKVRWFRNDQEETAGVVSTSLIR 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE6 QPDHLFRKFHYLPFVPSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGL . : :. . .: ..:. :.: ::::: .:..:. .:. : :: : CCDS56 NGDWTFQILVMLEITPQRGDIYTCQVEHPSLQSPITVEWR---PRGPPPAGLLH 180 190 200 210 220 230 240 250 pF1KE6 AIGLVGFLVGTVLIIMGTYVSSVPR 250 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 11:06:57 2016 done: Tue Nov 8 11:06:58 2016 Total Scan time: 1.640 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]