FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1991, 569 aa 1>>>pF1KE1991 569 - 569 aa - 569 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2041+/-0.000834; mu= 20.4293+/- 0.051 mean_var=86.7876+/-16.633, 0's: 0 Z-trim(109.8): 74 B-trim: 3 in 1/49 Lambda= 0.137672 statistics sampled from 11055 (11136) to 11055 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.695), E-opt: 0.2 (0.342), width: 16 Scan time: 3.240 The best scores are: opt bits E(32554) CCDS1387.1 CFHR5 gene_id:81494|Hs108|chr1 ( 569) 4094 823.2 0 CCDS1385.1 CFH gene_id:3075|Hs108|chr1 (1231) 1661 340.3 8.3e-93 CCDS55671.1 CFHR4 gene_id:10877|Hs108|chr1 ( 577) 1370 282.2 1.2e-75 CCDS1386.1 CFHR1 gene_id:3078|Hs108|chr1 ( 330) 1133 234.9 1.2e-61 CCDS30959.1 CFHR2 gene_id:3080|Hs108|chr1 ( 270) 929 194.3 1.6e-49 CCDS1388.1 F13B gene_id:2165|Hs108|chr1 ( 661) 924 193.7 6.2e-49 CCDS41451.1 CFHR4 gene_id:10877|Hs108|chr1 ( 331) 719 152.7 6.8e-37 CCDS53453.1 CFHR3 gene_id:10878|Hs108|chr1 ( 269) 710 150.8 2e-36 CCDS30958.1 CFHR3 gene_id:10878|Hs108|chr1 ( 330) 684 145.7 8.4e-35 CCDS55189.1 CSMD1 gene_id:64478|Hs108|chr8 (3564) 475 105.2 1.5e-21 CCDS6316.2 CSMD3 gene_id:114788|Hs108|chr8 (3538) 471 104.4 2.5e-21 CCDS6317.1 CSMD3 gene_id:114788|Hs108|chr8 (3667) 471 104.4 2.6e-21 CCDS6315.1 CSMD3 gene_id:114788|Hs108|chr8 (3707) 471 104.4 2.6e-21 CCDS60082.1 CSMD2 gene_id:114784|Hs108|chr1 (3631) 470 104.2 2.9e-21 CCDS380.1 CSMD2 gene_id:114784|Hs108|chr1 (3487) 457 101.6 1.7e-20 CCDS53452.1 CFH gene_id:3075|Hs108|chr1 ( 449) 415 92.4 1.3e-18 CCDS1283.1 SELE gene_id:6401|Hs108|chr1 ( 610) 399 89.3 1.4e-17 CCDS44310.1 CR1L gene_id:1379|Hs108|chr1 ( 569) 344 78.4 2.7e-14 CCDS31007.1 CR2 gene_id:1380|Hs108|chr1 (1092) 339 77.7 8.4e-14 CCDS44309.1 CR1 gene_id:1378|Hs108|chr1 (2039) 316 73.4 3.1e-12 CCDS1478.1 CR2 gene_id:1380|Hs108|chr1 (1033) 312 72.3 3.3e-12 >>CCDS1387.1 CFHR5 gene_id:81494|Hs108|chr1 (569 aa) initn: 4094 init1: 4094 opt: 4094 Z-score: 4395.6 bits: 823.2 E(32554): 0 Smith-Waterman score: 4094; 100.0% identity (100.0% similar) in 569 aa overlap (1-569:1-569) 10 20 30 40 50 60 pF1KE1 MLLLFSVILISWVSTVGGEGTLCDFPKIHHGFLYDEEDYNPFSQVPTGEVFYYSCEYNFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MLLLFSVILISWVSTVGGEGTLCDFPKIHHGFLYDEEDYNPFSQVPTGEVFYYSCEYNFV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 SPSKSFWTRITCTEEGWSPTPKCLRMCSFPFVKNGHSESSGLIHLEGDTVQIICNTGYSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SPSKSFWTRITCTEEGWSPTPKCLRMCSFPFVKNGHSESSGLIHLEGDTVQIICNTGYSL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 QNNEKNISCVERGWSTPPICSFTKGECHVPILEANVDAQPKKESYKVGDVLKFSCRKNLI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QNNEKNISCVERGWSTPPICSFTKGECHVPILEANVDAQPKKESYKVGDVLKFSCRKNLI 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 RVGSDSVQCYQFGWSPNFPTCKGQVRSCGPPPQLSNGEVKEIRKEEYGHNEVVEYDCNPN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RVGSDSVQCYQFGWSPNFPTCKGQVRSCGPPPQLSNGEVKEIRKEEYGHNEVVEYDCNPN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 FIINGPKKIQCVDGEWTTLPTCVEQVKTCGYIPELEYGYVQPSVPPYQHGVSVEVNCRNE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 FIINGPKKIQCVDGEWTTLPTCVEQVKTCGYIPELEYGYVQPSVPPYQHGVSVEVNCRNE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 YAMIGNNMITCINGIWTELPMCVATHQLKRCKIAGVNIKTLLKLSGKEFNHNSRIRYRCS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YAMIGNNMITCINGIWTELPMCVATHQLKRCKIAGVNIKTLLKLSGKEFNHNSRIRYRCS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 DIFRYRHSVCINGKWNPEVDCTEKREQFCPPPPQIPNAQNMTTTVNYQDGEKVAVLCKEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DIFRYRHSVCINGKWNPEVDCTEKREQFCPPPPQIPNAQNMTTTVNYQDGEKVAVLCKEN 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 YLLPEAKEIVCKDGRWQSLPRCVESTAYCGPPPSINNGDTTSFPLSVYPPGSTVTYRCQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 YLLPEAKEIVCKDGRWQSLPRCVESTAYCGPPPSINNGDTTSFPLSVYPPGSTVTYRCQS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 FYKLQGSVTVTCRNKQWSEPPRCLDPCVVSEENMNKNNIQLKWRNDGKLYAKTGDAVEFQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 FYKLQGSVTVTCRNKQWSEPPRCLDPCVVSEENMNKNNIQLKWRNDGKLYAKTGDAVEFQ 490 500 510 520 530 540 550 560 pF1KE1 CKFPHKAMISSPPFRAICQEGKFEYPICE ::::::::::::::::::::::::::::: CCDS13 CKFPHKAMISSPPFRAICQEGKFEYPICE 550 560 >>CCDS1385.1 CFH gene_id:3075|Hs108|chr1 (1231 aa) initn: 2082 init1: 1465 opt: 1661 Z-score: 1779.6 bits: 340.3 E(32554): 8.3e-93 Smith-Waterman score: 1661; 46.2% identity (70.9% similar) in 519 aa overlap (53-566:475-981) 30 40 50 60 70 80 pF1KE1 CDFPKIHHGFLYDEEDYNPFSQVPTGEVFYYSCEYNFVSPSKSFWTRITCTEEGWSPTPK :.:. ..:. . ::: ..::: : CCDS13 VKTCSKSSIDIENGFISESQYTYALKEKAKYQCKLGYVTADGETSGSITCGKDGWSAQPT 450 460 470 480 490 500 90 100 110 120 130 140 pF1KE1 CLRMCSFPFVKNGHSESSGLIHLEGDTVQIICNTGY--SLQNNEKNISCVERGWSTPPIC :.. :..: :...... .::.. :. :: . .. .: : ::: ::: CCDS13 CIKSCDIPVFMNARTKNDFTWFKLNDTLDYECHDGYESNTGSTTGSIVCGYNGWSDLPIC 510 520 530 540 550 560 150 160 170 180 190 200 pF1KE1 SFTKGECHVPILEANVDAQPKKESYKVGDVLKFSCRKNLIRVGSDSVQCYQFGWSPNFPT . . ::..: ..... . ::..::::.::::::. .. :: .:::::.:: ::..: CCDS13 -YER-ECELPKIDVHLVPDRKKDQYKVGEVLKFSCKPGFTIVGPNSVQCYHFGLSPDLPI 570 580 590 600 610 620 210 220 230 240 250 260 pF1KE1 CKGQVRSCGPPPQLSNGEVKEIRKEEYGHNEVVEYDCNPNFIINGPKKIQCVDGEWTTLP :: ::.::::::.: ::.::: ::::::.::::: ::: :...::.::::::::::::: CCDS13 CKEQVQSCGPPPELLNGNVKEKTKEEYGHSEVVEYYCNPRFLMKGPNKIQCVDGEWTTLP 630 640 650 660 670 680 270 280 290 300 310 320 pF1KE1 TCVEQVKTCGYIPELEYGYVQPSVPPYQHGVSVEVNCRNEYAMIGNNMITCINGIWTELP .:. . .::: :::::.:..: : ::: .: ::: :: . ..:::. ::::.:.::.:: CCDS13 VCIVEESTCGDIPELEHGWAQLSSPPYYYGDSVEFNCSESFTMIGHRSITCIHGVWTQLP 690 700 710 720 730 740 330 340 350 360 370 380 pF1KE1 MCVATHQLKRCKIAGVNIKTLLKLSGKEFNHNSRIRYRCSDIFRYRHSVCINGKWNPEVD .::: .::.:: ... : . :::.::: ::::: . :.:::::.:.:::. CCDS13 QCVAIDKLKKCKSSNLIILEEHLKNKKEFDHNSNIRYRCRGKEGWIHTVCINGRWDPEVN 750 760 770 780 790 800 390 400 410 420 430 440 pF1KE1 CTEKREQFCPPPPQIPNAQNMTTTVNYQDGEKVAVLCKENYLLPEAKEIVCKDGRWQSLP :. . :.:::::::::..:::::.::.:::::.:::.::::. :..::.::::::::.: CCDS13 CSMAQIQLCPPPPQIPNSHNMTTTLNYRDGEKVSVLCQENYLIQEGEEITCKDGRWQSIP 810 820 830 840 850 860 450 460 470 480 490 pF1KE1 RCVESTAYCGPPPSINNGDTTSFPLS--VYPPGSTVTYRCQSFYKLQGSVTVTCRNKQWS :::. :. ::.:..: .: : : :. ..: :.. .... .:: .:: CCDS13 LCVEKIP-CSQPPQIEHGTINSSRSSQESYAHGTKLSYTCEGGFRISEENETTCYMGKWS 870 880 890 900 910 920 500 510 520 530 540 550 pF1KE1 EPPRCLD-PCVVSEENMNKNNIQLKWRNDGKLYAKTGDAVEFQCKFPHKAMISSPPFRAI ::.: :: : . .. .:. : :. : ..: : . :..: . : CCDS13 SPPQCEGLPCKSPPEISHGVVAHM---SDSYQY---GEEVTYKC-FEGFG-IDGPAI-AK 930 940 950 960 970 560 pF1KE1 CQEGKFEYPICE : :. .: CCDS13 CLGEKWSHPPSCIKTDCLSLPSFENAIPMGEKKDVYKAGEQVTYTCATYYKMDGASNVTC 980 990 1000 1010 1020 1030 >-- initn: 884 init1: 631 opt: 713 Z-score: 762.0 bits: 152.0 E(32554): 4e-36 Smith-Waterman score: 713; 38.8% identity (65.9% similar) in 255 aa overlap (320-568:982-1228) 290 300 310 320 330 340 pF1KE1 GVSVEVNCRNEYAMIGNNMITCINGIWTELPMCVATHQLKRCKIAGVNIKTLLKLSGKE- : :. : : .. .... . .. :. CCDS13 GEEVTYKCFEGFGIDGPAIAKCLGEKWSHPPSCIKTD----C-LSLPSFENAIPMGEKKD 960 970 980 990 1000 350 360 370 380 390 400 pF1KE1 -FNHNSRIRYRCSDIFRY---RHSVCINGKWNPEVDCTEKREQFCPPPPQIPNAQNMTTT .. . .. : :. ... . .:::..:. . : :. : :: . :: .. CCDS13 VYKAGEQVTYTCATYYKMDGASNVTCINSRWTGRPTC---RDTSCVNPPTVQNAYIVSRQ 1010 1020 1030 1040 1050 1060 410 420 430 440 450 460 pF1KE1 VN-YQDGEKVAVLCKENYLLPEAKEIVCKDGRWQSLPRCVESTAYCGPPPSINNGDTTSF .. : .::.: :. : . .:..: .: : :.: .::. ::::: :.::: ::: CCDS13 MSKYPSGERVRYQCRSPYEMFGDEEVMCLNGNWTEPPQCKDSTGKCGPPPPIDNGDITSF 1070 1080 1090 1100 1110 1120 470 480 490 500 510 520 pF1KE1 PLSVYPPGSTVTYRCQSFYKLQGSVTVTCRNKQWSEPPRCLDPCVVSEENMNKNNIQLKW ::::: :.:.: :.::..:.:.:. .:::: ::::::.:: :::.:.: :.. :: :.: CCDS13 PLSVYAPASSVEYQCQNLYQLEGNKRITCRNGQWSEPPKCLHPCVISREIMENYNIALRW 1130 1140 1150 1160 1170 1180 530 540 550 560 pF1KE1 RNDGKLYAKTGDAVEFQCKFPHKAMISSPPFRAICQEGKFEYPICE :::..::..::: :: .. : .:. : .::.::: : CCDS13 TAKQKLYSRTGESVEFVCKRGYRLSSRSHTLRTTCWDGKLEYPTCAKR 1190 1200 1210 1220 1230 >-- initn: 475 init1: 413 opt: 413 Z-score: 440.0 bits: 92.4 E(32554): 3.5e-18 Smith-Waterman score: 413; 39.8% identity (70.3% similar) in 118 aa overlap (23-140:325-442) 10 20 30 40 50 pF1KE1 MLLLFSVILISWVSTVGGEGTLCDFPKIHHGFLYDEEDYNPFSQVPTGEVFY ::.: :.:: :: :. :. : .:. . CCDS13 RNGFYPATRGNTAKCTSTGWIPAPRCTLKPCDYPDIKHGGLYHENMRRPYFPVAVGKYYS 300 310 320 330 340 350 60 70 80 90 100 110 pF1KE1 YSCEYNFVSPSKSFWTRITCTEEGWSPTPKCLRMCSFPFVKNGHSESSGLIHLEGDTVQI : :. .: .:: :.: .: ::..::::. ::: : ::...::.... : ..: .... CCDS13 YYCDEHFETPSGSYWDHIHCTQDGWSPAVPCLRKCYFPYLENGYNQNHGRKFVQGKSIDV 360 370 380 390 400 410 120 130 140 150 160 170 pF1KE1 ICNTGYSLQNNEKNISCVERGWSTPPICSFTKGECHVPILEANVDAQPKKESYKVGDVLK :. ::.: . . ...:.: ::: : : CCDS13 ACHPGYALPKAQTTVTCMENGWSPTPRCIRVKTCSKSSIDIENGFISESQYTYALKEKAK 420 430 440 450 460 470 >>CCDS55671.1 CFHR4 gene_id:10877|Hs108|chr1 (577 aa) initn: 1182 init1: 629 opt: 1370 Z-score: 1471.5 bits: 282.2 E(32554): 1.2e-75 Smith-Waterman score: 1370; 36.5% identity (62.4% similar) in 595 aa overlap (1-569:1-577) 10 20 30 40 50 60 pF1KE1 MLLLFSVILISWVSTVGGEGTLCDFPKIHHGFLYDEEDYNPFSQVPTGEVFYYSCEYNFV ::::..::: ::: ..:. ::::.:.:: :: . . . .:. . : :. ::: CCDS55 MLLLINVILTLWVSCANGQVKPCDFPEIQHGGLYYKSLRRLYFPAAAGQSYSYYCDQNFV 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 SPSKSFWTRITCTEEGWSPTPKCLRMCSFP--FVKNGHSESSGLIHLEGDTVQIICNTGY .:: :.: : ::..::::: ::: :: ..:: :. :.. .. .: :. :: CCDS55 TPSGSYWDYIHCTQDGWSPTVPCLRTCSKSDVEIENGFISESSSIYILNEETQYNCKPGY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 SLQ--NNEKNISCVERGWSTPPIC-SFTKGECHVPILEANVDAQPKKESYKVGDVLKFSC . :. .:.:.. :::: ::: .: : .:..: : :. . .:. :.: . : CCDS55 ATAEGNSSGSITCLQNGWSTQPICIKF----CDMPVFE-NSRAKSNGMWFKLHDTLDYEC 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 RKNL-IRVG--SDSVQCYQFGWSPNFPTCKGQVRSCGPPPQLSNGEVKEIRKEEYGHNEV . : .::. : . ::: ..::: .. ..::::: .:::.. . .. : CCDS55 YDGYESSYGNTTDSIVCGEDGWS-HLPTCYNSSENCGPPPPISNGDTTSFPQKVYLPWSR 180 190 200 210 220 230 240 250 260 270 280 pF1KE1 VEYDCNPNFIINGPKKIQCVDGEWTTLPTCVEQVKTCGYIPELEYG--YVQPSVPPY--- :::.:. . ..: : . : .:.:. : :. ..: : . ::...: : . . :: CCDS55 VEYQCQSYYELQGSKYVTCSNGDWSEPPRCI-SMKPCEF-PEIQHGHLYYENTRRPYFPV 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 QHGVSVEVNCRNEYAMIGN---NMITCINGIWTELPMCVATHQLKRCKIAGVNIKT-LLK : : : .... .. ..: : . : : :. :. . ..:.. ... CCDS55 ATGQSYSYYCDQNFVTPSGSYWDYIHCTQDGWLPTVPC-----LRTCSKSDIEIENGFIS 300 310 320 330 340 350 360 370 380 390 pF1KE1 LSGKEFNHNSRIRYRCSDIFRYRHS------VCINGKWNPEVDCTEKREQFCPPPPQIPN :.. . :..:.:.:. . . .:... :. . : .:: : . : CCDS55 ESSSIYILNKEIQYKCKPGYATADGNSSGSITCLQNGWSAQPICI----KFCDMPV-FEN 350 360 370 380 390 400 400 410 420 430 440 450 pF1KE1 AQNMTTTVNYQDGEKVAVLCKENYLLPEAKE---IVCKDGRWQSLPRCVESTAYCGPPPS .. .. . .. . . : ..: . .. ::: . :. .: : .:. ::::: CCDS55 SRAKSNGMRFKLHDTLDYECYDGYEISYGNTTGSIVCGEDGWSHFPTCYNSSEKCGPPPP 410 420 430 440 450 460 460 470 480 490 500 510 pF1KE1 INNGDTTSFPLSVYPPGSTVTYRCQSFYKLQGSVTVTCRNKQWSEPPRCLDPCVVSEENM :.::::::: :.:: : : : :.:::.:.:::: ::: : .:::::::. ::...:::: CCDS55 ISNGDTTSFLLKVYVPQSRVEYQCQSYYELQGSNYVTCSNGEWSEPPRCIHPCIITEENM 470 480 490 500 510 520 520 530 540 550 560 pF1KE1 NKNNIQLKWRNDGKLYAKTGDAVEFQCKFPHKAMISSPPFRAICQEGKFEYPICE :::::::: ..: : ::::::..::.::. ..: : :.:.:.:: ::: :: CCDS55 NKNNIQLKGKSDIKYYAKTGDTIEFMCKLGYNANTSVLSFQAVCREGIVEYPRCE 530 540 550 560 570 >>CCDS1386.1 CFHR1 gene_id:3078|Hs108|chr1 (330 aa) initn: 1639 init1: 1031 opt: 1133 Z-score: 1220.2 bits: 234.9 E(32554): 1.2e-61 Smith-Waterman score: 1133; 51.7% identity (68.4% similar) in 329 aa overlap (1-322:1-327) 10 20 30 40 50 60 pF1KE1 MLLLFSVILISWVSTVGGEGTLCDFPKIHHGFLYDEEDYNPFSQVPTGEVFYYSCEYNFV : :: :::::: .:.::::.:.::::::.::.::::: :.:::::::::::::::::::: CCDS13 MWLLVSVILISRISSVGGEATFCDFPKINHGILYDEEKYKPFSQVPTGEVFYYSCEYNFV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 SPSKSFWTRITCTEEGWSPTPKCLRMCSFPFVKNGHSESSGLIHLEGDTVQIICNTGYSL :::::::::::::::::::::::::.: ::::.:::::::: ::::::::::::::: : CCDS13 SPSKSFWTRITCTEEGWSPTPKCLRLCFFPFVENGHSESSGQTHLEGDTVQIICNTGYRL 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 QNNEKNISCVERGWSTPPICSFTKGECHVPILEANVDAQPKKES-YKVGDVLKFSCRKNL ::::.::::::::::::: : : : : :. .. : : :. ... ::. CCDS13 QNNENNISCVERGWSTPPKCRSTDTSCVNPPTVQNAHILSRQMSKYPSGERVRYECRSPY 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 IRVGSDSVQCYQFGWSPNFPTCKGQVRSCGPPPQLSNGEVKEIRKEEYGHNEVVEYDCNP :.. :.: . .:. : :: .. .::::: ..::.. . :. :::.:. CCDS13 EMFGDEEVMCLNGNWTEP-PQCKDSTGKCGPPPPIDNGDITSFPLSVYAPASSVEYQCQN 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 NFIINGPKKIQCVDGEWTTLPTCVEQVKTCGYIPE---LEYGYVQPSVPPYQHGVSVEVN . ..: :.: : .:.:. : :.. : : . .. . . : :.: CCDS13 LYQLEGNKRITCRNGQWSEPPKCLHPCVISREIMENYNIALRWTAKQKLYLRTGESAEFV 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 CRNEYAMIGNNMI---TCINGIWTELPMCVATHQLKRCKIAGVNIKTLLKLSGKEFNHNS :. : . . . :: .: : : : CCDS13 CKRGYRLSSRSHTLRTTCWDGK-LEYPTCAKR 300 310 320 330 >>CCDS30959.1 CFHR2 gene_id:3080|Hs108|chr1 (270 aa) initn: 1476 init1: 857 opt: 929 Z-score: 1002.4 bits: 194.3 E(32554): 1.6e-49 Smith-Waterman score: 929; 53.5% identity (72.5% similar) in 273 aa overlap (1-265:1-270) 10 20 30 40 50 60 pF1KE1 MLLLFSVILISWVSTVGGEGTLCDFPKIHHGFLYDEEDYNPFSQVPTGEVFYYSCEYNFV : :: :::::: .:.::::. .::::::.::.::::: :.:::::::::::::::::::: CCDS30 MWLLVSVILISRISSVGGEAMFCDFPKINHGILYDEEKYKPFSQVPTGEVFYYSCEYNFV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 SPSKSFWTRITCTEEGWSPTPKCLRMCSFPFVKNGHSESSGLIHLEGDTVQIICNTGYSL ::::::::::::.::::::::::::.: ::::.:::::::: ::::::::::::::: : CCDS30 SPSKSFWTRITCAEEGWSPTPKCLRLCFFPFVENGHSESSGQTHLEGDTVQIICNTGYRL 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 QNNEKNISCVERGWSTPPIC--SFTKGECHVPILEANVDAQPKKES-YKVGDVLKFSCRK ::::.::::::::::::: : ... .: : : : : : :. ....: . CCDS30 QNNENNISCVERGWSTPPKCRSTISAEKCGPPPPIDNGDITSFLLSVYAPGSSVEYQC-Q 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 NLIRV-GSDSVQCYQFGWSPNFPTCKGQVRSCGPPPQLSNGEVKEIRKEE-YGHN-EVVE :: .. :.... : . :: : : . : ..: ... :... ..:: CCDS30 NLYQLEGNNQITCRNGQWSEP-PKCLDPCVISQEIMEKYNIKLKWTNQQKLYSRTGDIVE 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 YDCNPNFIINGPK--KIQCVDGEWTTLPTCVEQVKTCGYIPELEYGYVQPSVPPYQHGVS . :. .. . . . .: .:. . :.: :. CCDS30 FVCKSGYHPTKSHSFRAMCQNGK-LVYPSCEEK 240 250 260 270 300 310 320 330 340 350 pF1KE1 VEVNCRNEYAMIGNNMITCINGIWTELPMCVATHQLKRCKIAGVNIKTLLKLSGKEFNHN >>CCDS1388.1 F13B gene_id:2165|Hs108|chr1 (661 aa) initn: 861 init1: 456 opt: 924 Z-score: 992.0 bits: 193.7 E(32554): 6.2e-49 Smith-Waterman score: 945; 31.5% identity (59.6% similar) in 505 aa overlap (87-568:25-515) 60 70 80 90 100 pF1KE1 YNFVSPSKSFWTRITCTEEGWSPTPKCLRMCSFPFVKNG------HSESSGLIHLEGDT- :.:: :.:: .. .: . . : CCDS13 MRLKNLTFIIILIISGELYAEEKPCGFPHVENGRIAQYYYTFKSFYFPMSIDKK 10 20 30 40 50 110 120 130 140 150 160 pF1KE1 VQIICNTGYSLQNN--EKNISCVERGWSTPPICSFTKGECHVPILEANVDAQPKKESYKV ....: .::. ... :.. .:. .::: : : : : : : : .: . : ::. CCDS13 LSFFCLAGYTTESGRQEEQTTCTTEGWSPEPRC-FKK--CTKPDL-SNGYISDVKLLYKI 60 70 80 90 100 110 170 180 190 200 210 220 pF1KE1 GDVLKFSCRKNLIRVGS---DSVQCYQFGWSPNFPTCKGQVRSCGPPPQLSNGEVKEIRK . ....: .. .:. . ::: . ::: . :::. . ..: : .: ::. . .: CCDS13 QENMRYGCASGYKTTGGKDEEVVQCLSDGWSSQ-PTCRKEHETCLAP-ELYNGNYSTTQK 120 130 140 150 160 230 240 250 260 270 280 pF1KE1 EEYGHNEVVEYDCNPNFIINGPKK---IQCVDGEWTTLPTCVEQVKTCGYIPELEYGYVQ . .. :.:.: .. : :: ..:. :. : :. ..: :. . .: :: . CCDS13 T-FKVKDKVQYECATGYYTAGGKKTEEVECLTYGWSLTPKCT-KLK-CSSLRLIENGYFH 170 180 190 200 210 220 290 300 310 320 330 340 pF1KE1 PSVPPYQHGVSVEVNCRNEYAMIGNNMITCINGIW-TELPMCVATHQLKRCKIAGVNIKT : :..: :. :...: . :...: : : : : :.: . .. :: . :.. CCDS13 PVKQTYEEGDVVQFFCHENYYLSGSDLIQCYNFGWYPESPVCEGRRN--RCPPPPLPINS 230 240 250 260 270 280 350 360 370 380 390 pF1KE1 LLKLSGKEFNHNSRIRYRCSDIFRYRHSV---CINGKWNPEVDCTEKREQF-CPPPPQIP .. . . :. .. .: :. . :. : .:::. : : .:. : :: : CCDS13 KIQTHSTTYRHGEIVHIECELNFEIHGSAEIRCEDGKWTEPPKCIEGQEKVACEEPPFIE 290 300 310 320 330 340 400 410 420 430 440 450 pF1KE1 N-AQNMTTTVNYQDGEKVAVLCKENYLLPEAKEIVCKDGRWQSLPRCVESTAYCGPPPSI : : :. . . : .:.::. :: .::: ..::.:. :.: :.:::.. : :: . CCDS13 NGAANLHSKI-YYNGDKVTYACKSGYLLHGSNEITCNRGKWTLPPECVENNENCKHPPVV 350 360 370 380 390 400 460 470 480 490 500 510 pF1KE1 NNGDTTSFPLSVYPPGSTVTYRCQSFYKLQGSVTVTCRNKQWSEPPRCLDPCVVSEENMN :: ... :. : ::.: :::. .: :.:: :.. .:: :: ::.::.:. . :: CCDS13 MNGAVADGILASYATGSSVEYRCNEYYLLRGSKISRCEQGKWSSPPVCLEPCTVNVDYMN 410 420 430 440 450 460 520 530 540 550 560 pF1KE1 KNNIQLKWRNDGKLYAKTGDAVEFQCKFPHKAMISSP--PFRAICQEGKFEYPICE .:::..::. .::. :: ..: :: . .: . . :..:. .::.: CCDS13 RNNIEMKWKYEGKVLH--GDLIDFVCKQGYDLSPLTPLSELSVQCNRGEVKYPLCTRKES 470 480 490 500 510 520 CCDS13 KGMCTSPPLIKHGVIISSTVDTYENGSSVEYRCFDHHFLEGSREAYCLDGMWTTPPLCLE 530 540 550 560 570 580 >-- initn: 406 init1: 283 opt: 337 Z-score: 361.9 bits: 77.1 E(32554): 7.7e-14 Smith-Waterman score: 337; 36.7% identity (66.4% similar) in 128 aa overlap (444-568:519-646) 420 430 440 450 460 470 pF1KE1 AVLCKENYLLPEAKEIVCKDGRWQSLPRCVESTAYCGPPPSINNGDTTSFPLSVYPPGST :: ..: :: :..: : ...: ::. CCDS13 GYDLSPLTPLSELSVQCNRGEVKYPLCTRKESKGMCTSPPLIKHGVIISSTVDTYENGSS 490 500 510 520 530 540 480 490 500 510 520 530 pF1KE1 VTYRCQSFYKLQGSVTVTCRNKQWSEPPRCLDPCVVSEENMNKNNIQLKWRNDGKLYAKT : ::: . . :.:: . : . .:. :: ::.::..: .:.:::. ::: :.. . CCDS13 VEYRCFDHHFLEGSREAYCLDGMWTTPPLCLEPCTLSFTEMEKNNLLLKWDFDNRPHILH 550 560 570 580 590 600 540 550 560 pF1KE1 GDAVEFQCK---FPHKAMISSPPFRAICQEGKFEYPICE :. .:: :. .: . .:.. .: :..:...:: : CCDS13 GEYIEFICRGDTYPAELYITGSILRMQCDRGQLKYPRCIPRQSTLSYQEPLRT 610 620 630 640 650 660 >>CCDS41451.1 CFHR4 gene_id:10877|Hs108|chr1 (331 aa) initn: 942 init1: 629 opt: 719 Z-score: 775.8 bits: 152.7 E(32554): 6.8e-37 Smith-Waterman score: 720; 35.6% identity (62.0% similar) in 329 aa overlap (261-569:14-331) 240 250 260 270 280 pF1KE1 EVVEYDCNPNFIINGPKKIQCVDGEWTTLPTCV--EQVKTCGYIPELEYG--YVQPS--- .:. ..:: : . ::...: : . CCDS41 MLLLINVILTLWVSCANGQEVKPCDF-PEIQHGGLYYKSLRRL 10 20 30 40 290 300 310 320 330 340 pF1KE1 VPPYQHGVSVEVNCRNEYAMIGN---NMITCINGIWTELPMCVATHQLKRCKIAGVNIKT : : : : .... .. ..: : . :. : :. :. . ..:.. CCDS41 YFPAAAGQSYSYYCDQNFVTPSGSYWDYIHCTQDGWSPTVPC-----LRTCSKSDIEIEN 50 60 70 80 90 350 360 370 380 390 pF1KE1 -LLKLSGKEFNHNSRIRYRCSDIFRYRHS------VCINGKWNPEVDCTEKREQFCPPPP ... :.. . :..:.:.:. . . .:... :. . : .:: : CCDS41 GFISESSSIYILNKEIQYKCKPGYATADGNSSGSITCLQNGWSAQPICI----KFCDMPV 100 110 120 130 140 150 400 410 420 430 440 450 pF1KE1 QIPNAQNMTTTVNYQDGEKVAVLCKENYLLPEAKE---IVCKDGRWQSLPRCVESTAYCG . :.. .. . .. . . : ..: . .. ::: . :. .: : .:. :: CCDS41 -FENSRAKSNGMRFKLHDTLDYECYDGYEISYGNTTGSIVCGEDGWSHFPTCYNSSEKCG 160 170 180 190 200 210 460 470 480 490 500 510 pF1KE1 PPPSINNGDTTSFPLSVYPPGSTVTYRCQSFYKLQGSVTVTCRNKQWSEPPRCLDPCVVS ::: :.::::::: :.:: : : : :.:::.:.:::: ::: : .:::::::. ::... CCDS41 PPPPISNGDTTSFLLKVYVPQSRVEYQCQSYYELQGSNYVTCSNGEWSEPPRCIHPCIIT 220 230 240 250 260 270 520 530 540 550 560 pF1KE1 EENMNKNNIQLKWRNDGKLYAKTGDAVEFQCKFPHKAMISSPPFRAICQEGKFEYPICE :::::::::::: ..: : ::::::..::.::. ..: : :.:.:.:: ::: :: CCDS41 EENMNKNNIQLKGKSDIKYYAKTGDTIEFMCKLGYNANTSVLSFQAVCREGIVEYPRCE 280 290 300 310 320 330 >>CCDS53453.1 CFHR3 gene_id:10878|Hs108|chr1 (269 aa) initn: 1029 init1: 572 opt: 710 Z-score: 767.3 bits: 150.8 E(32554): 2e-36 Smith-Waterman score: 710; 42.2% identity (63.5% similar) in 277 aa overlap (308-569:1-269) 280 290 300 310 320 330 pF1KE1 GYVQPSVPPYQHGVSVEVNCRNEYAMIGNNMITCINGIWTELPMCVATHQLKRCKIAGVN :. :: : : : :. :.: : . .. CCDS53 MLLLINVILTLWVSC-ANGQVKPCDFPDIK 10 20 340 350 360 370 380 pF1KE1 IKTLLKLSGKE----FNHNSRIRYRCSDIFR--------YRHSVCINGKWNPEVDCTEKR :.. . .. .. : :.. :. : : : .. :.: : : .: CCDS53 HGGLFHENMRRPYFPVAVGKYYSYYCDEHFETPSGSYWDYIH--CTQNGWSPAVPCLRK- 30 40 50 60 70 80 390 400 410 420 430 440 pF1KE1 EQFCPPPPQIPNAQNMTTTVNYQDGEKVAVLCKENYLLPEAKEIV-CKDGRWQSLPRC-- : : . :. :.. .. .:... : :. .: ::.:. : : . :. ::: CCDS53 ---CYFP-YLENGYNQNYGRKFVQGNSTEVACHPGYGLPKAQTTVTCTEKGWSPTPRCIR 90 100 110 120 130 140 450 460 470 480 490 500 pF1KE1 VESTAYCGPPPSINNGDTTSFPLSVYPPGSTVTYRCQSFYKLQGSVTVTCRNKQWSEPPR :.:. ::::: :.::::::: :.:: : : : :.:: .:.:::: ::: : .:::::: CCDS53 VNSSEKCGPPPPISNGDTTSFLLKVYVPQSRVEYQCQPYYELQGSNYVTCSNGEWSEPPR 150 160 170 180 190 200 510 520 530 540 550 560 pF1KE1 CLDPCVVSEENMNKNNIQLKWRNDGKLYAKTGDAVEFQCKFPHKAMISSPPFRAICQEGK :. ::...:::::::::.:: :.: : ::::::..::.::. ..: : :.:.:.:: CCDS53 CIHPCIITEENMNKNNIKLKGRSDRKYYAKTGDTIEFMCKLGYNANTSILSFQAVCREGI 210 220 230 240 250 260 pF1KE1 FEYPICE ::: :: CCDS53 VEYPRCE >>CCDS30958.1 CFHR3 gene_id:10878|Hs108|chr1 (330 aa) initn: 1061 init1: 604 opt: 684 Z-score: 738.3 bits: 145.7 E(32554): 8.4e-35 Smith-Waterman score: 704; 34.0% identity (57.3% similar) in 379 aa overlap (200-569:14-330) 170 180 190 200 210 220 pF1KE1 VLKFSCRKNLIRVGSDSVQCYQFGWSPNFPTC-KGQVRSCGPPPQLSNGEVKEIRKEEY- .: .:::. : : .: .: .. : CCDS30 MLLLINVILTLWVSCANGQVKPCDFPDIKHGGLFHENMRRPYF 10 20 30 40 230 240 250 260 270 280 pF1KE1 --GHNEVVEYDCNPNF-IINGP--KKIQCVDGEWTTLPTCVEQVKTCGYIPELEYGYVQP . .. : :. .: .: :.:... :. :... : :.: :: :: : CCDS30 PVAVGKYYSYYCDEHFETPSGSYWDYIHCTQNGWSPAVPCLRK---C-YFPYLENGYNQN 50 60 70 80 90 290 300 310 320 330 340 pF1KE1 SVPPYQHGVSVEVNCRNEYAMI-GNNMITCINGIWTELPMCVATHQLKRCKIAGVNIKT- . .: :.:: :. :.. ... .:: . :. : :. ... :. . ..:.. CCDS30 YGRKFVQGNSTEVACHPGYGLPKAQTTVTCTEKGWSPTPRCI---RVRTCSKSDIEIENG 100 110 120 130 140 150 350 360 370 380 390 400 pF1KE1 LLKLSGKEFNHNSRIRYRCSDIFRYRHSVCINGKWNPEVDCTEKREQFCPPPPQIPNAQN ... :.. . :..:.:.:. : .: CCDS30 FISESSSIYILNKEIQYKCK--------------------------------PGYATA-- 160 170 180 410 420 430 440 450 460 pF1KE1 MTTTVNYQDGEKVAVLCKENYLLPEAKEIVCKDGRWQSLPRCVESTAYCGPPPSINNGDT ::.. . :.: .. :.. : :..:. ::::: :.:::: CCDS30 --------DGNS-------------SGSITCLQNGWSAQPICINSSEKCGPPPPISNGDT 190 200 210 220 470 480 490 500 510 520 pF1KE1 TSFPLSVYPPGSTVTYRCQSFYKLQGSVTVTCRNKQWSEPPRCLDPCVVSEENMNKNNIQ ::: :.:: : : : :.:: .:.:::: ::: : .:::::::. ::...:::::::::. CCDS30 TSFLLKVYVPQSRVEYQCQPYYELQGSNYVTCSNGEWSEPPRCIHPCIITEENMNKNNIK 230 240 250 260 270 280 530 540 550 560 pF1KE1 LKWRNDGKLYAKTGDAVEFQCKFPHKAMISSPPFRAICQEGKFEYPICE :: :.: : ::::::..::.::. ..: : :.:.:.:: ::: :: CCDS30 LKGRSDRKYYAKTGDTIEFMCKLGYNANTSILSFQAVCREGIVEYPRCE 290 300 310 320 330 >>CCDS55189.1 CSMD1 gene_id:64478|Hs108|chr8 (3564 aa) initn: 117 init1: 96 opt: 475 Z-score: 500.6 bits: 105.2 E(32554): 1.5e-21 Smith-Waterman score: 500; 26.6% identity (53.5% similar) in 508 aa overlap (87-568:2738-3208) 60 70 80 90 100 110 pF1KE1 YNFVSPSKSFWTRITCTEEGWSPTPKCLRMCSFPFVKNGHSESSGLIHLEGDTVQIICNT :. : . .:. ..: .:.:.. ::: CCDS55 PGFRLVGTSVRICLQDHKWSGQTPVCVPITCGHPG-NPAHGFTNGSEFNLNDVVNFTCNT 2710 2720 2730 2740 2750 2760 120 130 140 150 160 170 pF1KE1 GYSLQNNEKNISCVERG-WSTP-PICSFTKGECHVPILEANV---DAQPKKESYKVGDVL :: ::. . .: : ::.: : : .. : : . :. : ::.. : . CCDS55 GYLLQGVSRA-QCRSNGQWSSPLPTCRVVN--CSDPGFVENAIRHGQQNFPESFEYGMSI 2770 2780 2790 2800 2810 2820 180 190 200 210 220 230 pF1KE1 KFSCRKNLIRVGSDSVQCYQFG-WSPNFPTCKGQVRSCGPPPQLSNGEVKEIRKEEYGHN . :.:.. .::... :. : :. ..: : . ::: : .:. . : . .. CCDS55 LYHCKKGFYLLGSSALTCMANGLWDRSLPKCLAI--SCGHPGVPANAV---LTGELFTYG 2830 2840 2850 2860 2870 240 250 260 270 280 pF1KE1 EVVEYDC-NPNFIINGPKKIQCVDGEWT-TLPTCV-EQVKTCGYIPELEYGYVQPSVPPY ::.:.: . . .:.. .. :..:. .:: :. .. :: .: . . CCDS55 AVVHYSCRGSESLIGNDTRVCQEDSHWSGALPHCTGNNPGFCGDPGTPAHGSRLGD--DF 2880 2890 2900 2910 2920 2930 290 300 310 320 330 340 pF1KE1 QHGVSVEVNCRNEYAMIGNNMITCI-NGIWTEL-PMCVATHQLKRCKIAGVNIKTLLKLS . .. .:. . . :. ::. :: :. : :.: :. : :. . .. .: CCDS55 KTKSLLRFSCEMGHQLRGSPERTCLLNGSWSGLQPVCEAVS----CGNPGTPTNGMI-VS 2940 2950 2960 2970 2980 2990 350 360 370 380 390 pF1KE1 GKEFNHNSRIRYRCSDIFRY-----RHSVCINGKWNPEV-DCTEKREQFCPPPPQIPNAQ . . .: . : : . .. :: . :: :. . ::: : : . :. CCDS55 SDGILFSSSVIYACWEGYKTSGLMTRHCTA-NGTWTGTAPDCTIIS---CGDPGTLANGI 3000 3010 3020 3030 3040 400 410 420 430 440 450 pF1KE1 NMTTTVNYQDGEKVAVLCKENYLLPE--AKEIVC-KDGRWQ-SLPRCVESTAYCGPPPSI .. : ... . :. :. .:.. . : : :::::. : : : ... : :: . CCDS55 QFGTDFTFN--KTVSYQCNPGYVMEAVTSATIRCTKDGRWNPSKPVC--KAVLCPQPPPV 3050 3060 3070 3080 3090 3100 460 470 480 490 500 510 pF1KE1 NNGDTTSFPLSVYPPGSTVTYRCQSFYKLQGSVTVTCRNKQ-WS-EPPRCLDPCVVSEEN .:: . . : . ::...: :.. :.:. :. ..:... :. : :.:: : .. . CCDS55 QNGTVEG---SDFRWGSSISYSCMDGYQLSHSAILSCEGRGVWKGEIPQCL-PVFCGDPG 3110 3120 3130 3140 3150 520 530 540 550 560 pF1KE1 MNKNNIQLKWRNDGKLYAKTGDAVEFQCKFPHKAMISSPPFRAICQ-EGKFE--YPICE : . : .:: .. .. : :::: : . :: : .:: .: . : : CCDS55 -----IPAEGRLSGKSFTYKSE-VFFQCKSPFILVGSS---RRVCQADGTWSGIQPTCID 3160 3170 3180 3190 3200 3210 CCDS55 PAHNTCPDPGTPHFGIQNSSRGYEVGSTVFFRCRKGYHIQGSTTRTCLANLTWSGIQTEC 3220 3230 3240 3250 3260 3270 569 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 18:44:53 2016 done: Sun Nov 6 18:44:54 2016 Total Scan time: 3.240 Total Display time: 0.100 Function used was FASTA [36.3.4 Apr, 2011]