FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6484, 621 aa
1>>>pF1KE6484 621 - 621 aa - 621 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.4230+/-0.000985; mu= 18.7026+/- 0.059
mean_var=68.5042+/-13.509, 0's: 0 Z-trim(104.5): 27 B-trim: 0 in 0/48
Lambda= 0.154959
statistics sampled from 7919 (7929) to 7919 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.612), E-opt: 0.2 (0.244), width: 16
Scan time: 2.300
The best scores are: opt bits E(32554)
CCDS47718.1 AGBL3 gene_id:340351|Hs108|chr7 ( 920) 4236 956.5 0
CCDS7944.1 AGBL2 gene_id:79841|Hs108|chr11 ( 902) 2308 525.5 1.2e-148
CCDS6672.1 AGTPBP1 gene_id:23287|Hs108|chr9 (1186) 702 166.5 1.8e-40
CCDS83382.1 AGTPBP1 gene_id:23287|Hs108|chr9 (1226) 702 166.5 1.8e-40
CCDS69615.1 AGTPBP1 gene_id:23287|Hs108|chr9 (1238) 702 166.5 1.8e-40
CCDS75854.1 AGTPBP1 gene_id:23287|Hs108|chr9 (1278) 702 166.6 1.9e-40
CCDS44137.1 AGBL4 gene_id:84871|Hs108|chr1 ( 503) 627 149.6 9.6e-36
CCDS58398.1 AGBL1 gene_id:123624|Hs108|chr15 (1066) 494 120.0 1.6e-26
CCDS42665.1 AGBL5 gene_id:60509|Hs108|chr2 ( 717) 282 72.5 2.1e-12
CCDS1732.3 AGBL5 gene_id:60509|Hs108|chr2 ( 886) 282 72.6 2.5e-12
>>CCDS47718.1 AGBL3 gene_id:340351|Hs108|chr7 (920 aa)
initn: 4236 init1: 4236 opt: 4236 Z-score: 5111.7 bits: 956.5 E(32554): 0
Smith-Waterman score: 4236; 99.8% identity (100.0% similar) in 613 aa overlap (1-613:1-613)
10 20 30 40 50 60
pF1KE6 MSEDSEKEDYSDRTISDEDESDEDMFMKFVSEDLHRCALLTADSFGDPFFPRTTQILLEY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MSEDSEKEDYSDRTISDEDESDEDMFMKFVSEDLHRCALLTADSFGDPFFPRTTQILLEY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 QLGRWVPRLREPRDLYGVSSSGPLSPTRWPYHCEVIDEKVQHIDWTPSCPEPVYIPTGLE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QLGRWVPRLREPRDLYGVSSSGPLSPTRWPYHCEVIDEKVQHIDWTPSCPEPVYIPTGLE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 TQPLYPDSKEATVVYLAEDAYKEPCFVYSRVGGNRTPLKQPVDYRDNTLMFEARFESGNL
:.::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TEPLYPDSKEATVVYLAEDAYKEPCFVYSRVGGNRTPLKQPVDYRDNTLMFEARFESGNL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 QKVVKVAEYEYQLTVRPDLFTNKHTQWYYFQVTNMRAGIVYRFTIVNFTKPASLYSRGMR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 QKVVKVAEYEYQLTVRPDLFTNKHTQWYYFQVTNMRAGIVYRFTIVNFTKPASLYSRGMR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE6 PLFYSEKEAKAHHIGWQRIGDQIKYYRNNPGQDGRHYFSLTWTFQFPHNKDTCYFAHCYP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PLFYSEKEAKAHHIGWQRIGDQIKYYRNNPGQDGRHYFSLTWTFQFPHNKDTCYFAHCYP
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE6 YTYTNLQEYLSGINNDPVRSKFCKIRVLCHTLARNMVYILTITTPLKNSDSRKRKAVILT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 YTYTNLQEYLSGINNDPVRSKFCKIRVLCHTLARNMVYILTITTPLKNSDSRKRKAVILT
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE6 ARVHPGETNSSWIMKGFLDYILGNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 ARVHPGETNSSWIMKGFLDYILGNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGR
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE6 DLNRNYTSLLKESFPSVWYTRNMVHRLMEKREVILYCDLHGHSRKENIFMYGCDGSDRSK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DLNRNYTSLLKESFPSVWYTRNMVHRLMEKREVILYCDLHGHSRKENIFMYGCDGSDRSK
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE6 TLYLQQRIFPLMLSKNCPDKFSFSACKFNVQKSKEGTGRVVMWKMGIRNSFTMEATFCGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TLYLQQRIFPLMLSKNCPDKFSFSACKFNVQKSKEGTGRVVMWKMGIRNSFTMEATFCGS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE6 TLGNKRGTHFSTKDLESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMERHITLEKVFEDS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 TLGNKRGTHFSTKDLESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMERHITLEKVFEDS
550 560 570 580 590 600
610 620
pF1KE6 DTPVIDITLDVESRELTFLLR
:::::::::::::
CCDS47 DTPVIDITLDVESSSRGSDSSESIDSLTYLLKLTSQKKHLKTKKERNSTIASHQNARGQE
610 620 630 640 650 660
>>CCDS7944.1 AGBL2 gene_id:79841|Hs108|chr11 (902 aa)
initn: 2197 init1: 799 opt: 2308 Z-score: 2782.4 bits: 525.5 E(32554): 1.2e-148
Smith-Waterman score: 2308; 58.1% identity (81.6% similar) in 575 aa overlap (52-613:144-715)
30 40 50 60 70 80
pF1KE6 DEDMFMKFVSEDLHRCALLTADSFGDPFFPRTTQILLEYQLGRWVPRLREPRDLYGV-SS
:. :.: . .: . ::::::..:... :.
CCDS79 PPPPRFKDSPASAFRVAGITDSHMLSLPHLRSRQLLYD-ELDEVNPRLREPQELFSILST
120 130 140 150 160 170
90 100 110 120 130 140
pF1KE6 SGPLSPTRWPYHCEVIDEKVQHIDWTPSCPEPVYIPTGLETQPLYPDSKEATVVYLAEDA
. ::. ::: .:::: :...::.:.: :: : : : : : :..:::: ...
CCDS79 KRPLQAPRWPIECEVIKENIHHIEWAPPQPEYFYQPKGNEKVPEIVGEKKGTVVYQLDSV
180 190 200 210 220 230
150 160 170 180 190
pF1KE6 YKEPC-FVYSRVGGNRTPLKQ-PVDYR---DNTLMFEARFESGNLQKVVKVAEYEYQLTV
: :. :::::.: .:. : . ::::.::.:::::::::.:.: :::.::.
CCDS79 PIEGSYFTSSRVGGKRGIVKELAVTLQGPEDNTLLFESRFESGNLQKAVRVDTYEYELTL
240 250 260 270 280 290
200 210 220 230 240 250
pF1KE6 RPDLFTNKHTQWYYFQVTNMRAGIVYRFTIVNFTKPASLYSRGMRPLFYSEKEAKAHHIG
: ::.:::::::.::.: : : .:::::::. :: :::. ::.::.::. .:....::
CCDS79 RTDLYTNKHTQWFYFRVQNTRKDATYRFTIVNLLKPKSLYTVGMKPLLYSQLDANTRNIG
300 310 320 330 340 350
260 270 280 290 300 310
pF1KE6 WQRIGDQIKYYRNNPGQDGRHYFSLTWTFQFPHNKDTCYFAHCYPYTYTNLQEYLSGINN
:.: :..::::.:: . . .. ::::.:::...:::.::: ::::::.:: :: .. :
CCDS79 WRREGNEIKYYKNNTDDGQQPFYCLTWTIQFPYDQDTCFFAHFYPYTYTDLQCYLLSVAN
360 370 380 390 400 410
320 330 340 350 360 370
pF1KE6 DPVRSKFCKIRVLCHTLARNMVYILTITTPLKN-SDSRKRKAVILTARVHPGETNSSWIM
.:..:.:::...::..:: : ::.::::.: .. ... .:::.:.:::::::.:.::.:
CCDS79 NPIQSQFCKLQTLCRSLAGNTVYLLTITNPSQTPQEAAAKKAVVLSARVHPGESNGSWVM
420 430 440 450 460 470
380 390 400 410 420 430
pF1KE6 KGFLDYILGNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGRDLNRNYTSLLKESF
:::::.::.:: ::::::: :::::.::::::::::::::::::::::::.: ..:::::
CCDS79 KGFLDFILSNSPDAQLLRDIFVFKVLPMLNPDGVIVGNYRCSLAGRDLNRHYKTILKESF
480 490 500 510 520 530
440 450 460 470 480 490
pF1KE6 PSVWYTRNMVHRLMEKREVILYCDLHGHSRKENIFMYGCDGSDRSKTLYLQQRIFPLMLS
: .::::::..::.:.:::.::::.::::::.:::.:::....:. .:..:.:::::
CCDS79 PCIWYTRNMIKRLLEEREVLLYCDFHGHSRKNNIFLYGCNNNNRK--YWLHERVFPLMLC
540 550 560 570 580 590
500 510 520 530 540 550
pF1KE6 KNCPDKFSFSACKFNVQKSKEGTGRVVMWKMGIRNSFTMEATFCGSTLGNKRGTHFSTKD
:: :::::: .:.:.::: ::::::::::.::: ::.:::.:: :::::::: :::. .:
CCDS79 KNAPDKFSFHSCNFKVQKCKEGTGRVVMWRMGILNSYTMESTFGGSTLGNKRDTHFTIED
600 610 620 630 640 650
560 570 580 590 600
pF1KE6 LESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMER---HITLEKVFEDSDTP--VIDITL
:.:.::: ::.:::.::::. :. .:: ::.:. : : .... .: : ::.:
CCDS79 LKSLGYHVCDTLLDFCDPDQMKFTQCLAELKELLRQEIHKKFHELGQDVDLEGSWSDISL
660 670 680 690 700 710
610 620
pF1KE6 -DVESRELTFLLR
:.::
CCDS79 SDIESSTSGSDSSLSDGLPVHLANIADELTQKKKMFKKKKKKSLQTRKQRNEQYQKKNLM
720 730 740 750 760 770
>>CCDS6672.1 AGTPBP1 gene_id:23287|Hs108|chr9 (1186 aa)
initn: 1034 init1: 386 opt: 702 Z-score: 840.2 bits: 166.5 E(32554): 1.8e-40
Smith-Waterman score: 1219; 39.5% identity (66.9% similar) in 532 aa overlap (67-567:582-1095)
40 50 60 70 80 90
pF1KE6 CALLTADSFGDPFFPRTTQILLEYQLGRWVPRLREPRDLYGVSSSGPLSPTRWPYHCEVI
: :..: ::: .. : : . ::
CCDS66 LCCTGVETEDDEDTESNSSVEQASVEVPDGPTLHDP-DLYIEIVKNTKSV---PEYSEVA
560 570 580 590 600
100 110 120 130 140 150
pF1KE6 -DEKVQHIDWTPSCPEPVYI-PTGLETQPLYPDSKEATVVYLAEDAYKEPCFVYSRVGGN
. :: : ::. : :.. . : .. ... .. . ::. . :
CCDS66 YPDYFGHIP--PPFKEPILERPYGVQRTKIAQDIER--LIHQSDIIDR---VVYDLDNPN
610 620 630 640 650 660
160 170 180 190 200 210
pF1KE6 RTPLKQPVDYRDNTLMFEARFESGNLQKVVKVAEYEYQLTVRPDLFTNKHTQWYYFQVTN
: . . . : :...::::::.::... . ::.: . :. .:.. ::.::.:..
CCDS66 YT-----IPEEGDILKFNSKFESGNLRKVIQIRKNEYDLILNSDINSNHYHQWFYFEVSG
670 680 690 700 710
220 230 240 250 260
pF1KE6 MRAGIVYRFTIVNFTKPASLYSRGMRPLFYSEKEAKAHHIGWQRIGDQIKYYRNN-----
:: :..:::.:.: : : .. ::.::.:: .:: . : :.: .: ::.:.
CCDS66 MRPGVAYRFNIINCEKSNSQFNYGMQPLMYSVQEALNARPWWIRMGTDICYYKNHFSRSS
720 730 740 750 760 770
270 280 290 300 310 320
pF1KE6 ---PGQDGRHYFSLTWTFQFPHNKDTCYFAHCYPYTYTNLQEYLSGINN--DPVRSKFCK
:: :. :...:.: .:::. :.::::. :::::..:: .:. ... .: . : :
CCDS66 VAAGGQKGKSYYTITFTVNFPHKDDVCYFAYHYPYTYSTLQMHLQKLESAHNPQQIYFRK
780 790 800 810 820 830
330 340 350 360 370
pF1KE6 IRVLCHTLARNMVYILTITT-PLKN-----SDSRKRKAVILTARVHPGETNSSWIMKGFL
:::.::. : ..:::. : .: :.: :.:.:::::::::.::.::: :
CCDS66 -DVLCETLSGNSCPLVTITAMPESNYYEHICHFRNRPYVFLSARVHPGETNASWVMKGTL
840 850 860 870 880 890
380 390 400 410 420 430
pF1KE6 DYILGNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGRDLNRNYTSLLKESFPSVW
.:...:. :: ::....::.:::::::::: ::.::::.:.::::.. : . :...
CCDS66 EYLMSNNPTAQSLRESYIFKIVPMLNPDGVINGNHRCSLSGEDLNRQWQSPSPDLHPTIY
900 910 920 930 940 950
440 450 460 470 480
pF1KE6 YTRNMVHRLME-KREVILYCDLHGHSRKENIFMYGCD-------GSDRSKTLYLQQ----
....... : :: ..::: ::::::.:.:::::. .: . . . .
CCDS66 HAKGLLQYLAAVKRLPLVYCDYHGHSRKKNVFMYGCSIKETVWHTNDNATSCDVVEDTGY
960 970 980 990 1000 1010
490 500 510 520 530 540
pF1KE6 RIFPLMLSKNCPDKFSFSACKFNVQKSKEGTGRVVMWK-MGIRNSFTMEATFCGSTLGNK
: .: .::. : : .:.:.: :.::::.:.:::.:. .:.. :.:::.:.:: :.
CCDS66 RTLPKILSHIAP-AFCMSSCSFVVEKSKESTARVVVWREIGVQRSYTMESTLCGCDQGKY
1020 1030 1040 1050 1060 1070
550 560 570 580 590 600
pF1KE6 RGTHFSTKDLESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMERHITLEKVFEDSDTPVI
.: ...:..:: :: .:: .::
CCDS66 KGLQIGTRELEEMGAKFCVGLLRLKRLTSPLEYNLPSSLLDFENDLIESSCKVTSPTTYV
1080 1090 1100 1110 1120 1130
>>CCDS83382.1 AGTPBP1 gene_id:23287|Hs108|chr9 (1226 aa)
initn: 1034 init1: 386 opt: 702 Z-score: 840.0 bits: 166.5 E(32554): 1.8e-40
Smith-Waterman score: 1219; 39.5% identity (66.9% similar) in 532 aa overlap (67-567:622-1135)
40 50 60 70 80 90
pF1KE6 CALLTADSFGDPFFPRTTQILLEYQLGRWVPRLREPRDLYGVSSSGPLSPTRWPYHCEVI
: :..: ::: .. : : . ::
CCDS83 LCCTGVETEDDEDTESNSSVEQASVEVPDGPTLHDP-DLYIEIVKNTKSV---PEYSEVA
600 610 620 630 640
100 110 120 130 140 150
pF1KE6 -DEKVQHIDWTPSCPEPVYI-PTGLETQPLYPDSKEATVVYLAEDAYKEPCFVYSRVGGN
. :: : ::. : :.. . : .. ... .. . ::. . :
CCDS83 YPDYFGHIP--PPFKEPILERPYGVQRTKIAQDIER--LIHQSDIIDR---VVYDLDNPN
650 660 670 680 690 700
160 170 180 190 200 210
pF1KE6 RTPLKQPVDYRDNTLMFEARFESGNLQKVVKVAEYEYQLTVRPDLFTNKHTQWYYFQVTN
: . . . : :...::::::.::... . ::.: . :. .:.. ::.::.:..
CCDS83 YT-----IPEEGDILKFNSKFESGNLRKVIQIRKNEYDLILNSDINSNHYHQWFYFEVSG
710 720 730 740 750
220 230 240 250 260
pF1KE6 MRAGIVYRFTIVNFTKPASLYSRGMRPLFYSEKEAKAHHIGWQRIGDQIKYYRNN-----
:: :..:::.:.: : : .. ::.::.:: .:: . : :.: .: ::.:.
CCDS83 MRPGVAYRFNIINCEKSNSQFNYGMQPLMYSVQEALNARPWWIRMGTDICYYKNHFSRSS
760 770 780 790 800 810
270 280 290 300 310 320
pF1KE6 ---PGQDGRHYFSLTWTFQFPHNKDTCYFAHCYPYTYTNLQEYLSGINN--DPVRSKFCK
:: :. :...:.: .:::. :.::::. :::::..:: .:. ... .: . : :
CCDS83 VAAGGQKGKSYYTITFTVNFPHKDDVCYFAYHYPYTYSTLQMHLQKLESAHNPQQIYFRK
820 830 840 850 860 870
330 340 350 360 370
pF1KE6 IRVLCHTLARNMVYILTITT-PLKN-----SDSRKRKAVILTARVHPGETNSSWIMKGFL
:::.::. : ..:::. : .: :.: :.:.:::::::::.::.::: :
CCDS83 -DVLCETLSGNSCPLVTITAMPESNYYEHICHFRNRPYVFLSARVHPGETNASWVMKGTL
880 890 900 910 920 930
380 390 400 410 420 430
pF1KE6 DYILGNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGRDLNRNYTSLLKESFPSVW
.:...:. :: ::....::.:::::::::: ::.::::.:.::::.. : . :...
CCDS83 EYLMSNNPTAQSLRESYIFKIVPMLNPDGVINGNHRCSLSGEDLNRQWQSPSPDLHPTIY
940 950 960 970 980 990
440 450 460 470 480
pF1KE6 YTRNMVHRLME-KREVILYCDLHGHSRKENIFMYGCD-------GSDRSKTLYLQQ----
....... : :: ..::: ::::::.:.:::::. .: . . . .
CCDS83 HAKGLLQYLAAVKRLPLVYCDYHGHSRKKNVFMYGCSIKETVWHTNDNATSCDVVEDTGY
1000 1010 1020 1030 1040 1050
490 500 510 520 530 540
pF1KE6 RIFPLMLSKNCPDKFSFSACKFNVQKSKEGTGRVVMWK-MGIRNSFTMEATFCGSTLGNK
: .: .::. : : .:.:.: :.::::.:.:::.:. .:.. :.:::.:.:: :.
CCDS83 RTLPKILSHIAP-AFCMSSCSFVVEKSKESTARVVVWREIGVQRSYTMESTLCGCDQGKY
1060 1070 1080 1090 1100 1110
550 560 570 580 590 600
pF1KE6 RGTHFSTKDLESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMERHITLEKVFEDSDTPVI
.: ...:..:: :: .:: .::
CCDS83 KGLQIGTRELEEMGAKFCVGLLRLKRLTSPLEYNLPSSLLDFENDLIESSCKVTSPTTYV
1120 1130 1140 1150 1160 1170
>>CCDS69615.1 AGTPBP1 gene_id:23287|Hs108|chr9 (1238 aa)
initn: 1034 init1: 386 opt: 702 Z-score: 839.9 bits: 166.5 E(32554): 1.8e-40
Smith-Waterman score: 1219; 39.5% identity (66.9% similar) in 532 aa overlap (67-567:634-1147)
40 50 60 70 80 90
pF1KE6 CALLTADSFGDPFFPRTTQILLEYQLGRWVPRLREPRDLYGVSSSGPLSPTRWPYHCEVI
: :..: ::: .. : : . ::
CCDS69 LCCTGVETEDDEDTESNSSVEQASVEVPDGPTLHDP-DLYIEIVKNTKSV---PEYSEVA
610 620 630 640 650
100 110 120 130 140 150
pF1KE6 -DEKVQHIDWTPSCPEPVYI-PTGLETQPLYPDSKEATVVYLAEDAYKEPCFVYSRVGGN
. :: : ::. : :.. . : .. ... .. . ::. . :
CCDS69 YPDYFGHIP--PPFKEPILERPYGVQRTKIAQDIER--LIHQSDIIDR---VVYDLDNPN
660 670 680 690 700 710
160 170 180 190 200 210
pF1KE6 RTPLKQPVDYRDNTLMFEARFESGNLQKVVKVAEYEYQLTVRPDLFTNKHTQWYYFQVTN
: . . . : :...::::::.::... . ::.: . :. .:.. ::.::.:..
CCDS69 YT-----IPEEGDILKFNSKFESGNLRKVIQIRKNEYDLILNSDINSNHYHQWFYFEVSG
720 730 740 750 760
220 230 240 250 260
pF1KE6 MRAGIVYRFTIVNFTKPASLYSRGMRPLFYSEKEAKAHHIGWQRIGDQIKYYRNN-----
:: :..:::.:.: : : .. ::.::.:: .:: . : :.: .: ::.:.
CCDS69 MRPGVAYRFNIINCEKSNSQFNYGMQPLMYSVQEALNARPWWIRMGTDICYYKNHFSRSS
770 780 790 800 810 820
270 280 290 300 310 320
pF1KE6 ---PGQDGRHYFSLTWTFQFPHNKDTCYFAHCYPYTYTNLQEYLSGINN--DPVRSKFCK
:: :. :...:.: .:::. :.::::. :::::..:: .:. ... .: . : :
CCDS69 VAAGGQKGKSYYTITFTVNFPHKDDVCYFAYHYPYTYSTLQMHLQKLESAHNPQQIYFRK
830 840 850 860 870 880
330 340 350 360 370
pF1KE6 IRVLCHTLARNMVYILTITT-PLKN-----SDSRKRKAVILTARVHPGETNSSWIMKGFL
:::.::. : ..:::. : .: :.: :.:.:::::::::.::.::: :
CCDS69 -DVLCETLSGNSCPLVTITAMPESNYYEHICHFRNRPYVFLSARVHPGETNASWVMKGTL
890 900 910 920 930 940
380 390 400 410 420 430
pF1KE6 DYILGNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGRDLNRNYTSLLKESFPSVW
.:...:. :: ::....::.:::::::::: ::.::::.:.::::.. : . :...
CCDS69 EYLMSNNPTAQSLRESYIFKIVPMLNPDGVINGNHRCSLSGEDLNRQWQSPSPDLHPTIY
950 960 970 980 990 1000
440 450 460 470 480
pF1KE6 YTRNMVHRLME-KREVILYCDLHGHSRKENIFMYGCD-------GSDRSKTLYLQQ----
....... : :: ..::: ::::::.:.:::::. .: . . . .
CCDS69 HAKGLLQYLAAVKRLPLVYCDYHGHSRKKNVFMYGCSIKETVWHTNDNATSCDVVEDTGY
1010 1020 1030 1040 1050 1060
490 500 510 520 530 540
pF1KE6 RIFPLMLSKNCPDKFSFSACKFNVQKSKEGTGRVVMWK-MGIRNSFTMEATFCGSTLGNK
: .: .::. : : .:.:.: :.::::.:.:::.:. .:.. :.:::.:.:: :.
CCDS69 RTLPKILSHIAP-AFCMSSCSFVVEKSKESTARVVVWREIGVQRSYTMESTLCGCDQGKY
1070 1080 1090 1100 1110 1120
550 560 570 580 590 600
pF1KE6 RGTHFSTKDLESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMERHITLEKVFEDSDTPVI
.: ...:..:: :: .:: .::
CCDS69 KGLQIGTRELEEMGAKFCVGLLRLKRLTSPLEYNLPSSLLDFENDLIESSCKVTSPTTYV
1130 1140 1150 1160 1170 1180
>>CCDS75854.1 AGTPBP1 gene_id:23287|Hs108|chr9 (1278 aa)
initn: 1034 init1: 386 opt: 702 Z-score: 839.7 bits: 166.6 E(32554): 1.9e-40
Smith-Waterman score: 1219; 39.5% identity (66.9% similar) in 532 aa overlap (67-567:674-1187)
40 50 60 70 80 90
pF1KE6 CALLTADSFGDPFFPRTTQILLEYQLGRWVPRLREPRDLYGVSSSGPLSPTRWPYHCEVI
: :..: ::: .. : : . ::
CCDS75 LCCTGVETEDDEDTESNSSVEQASVEVPDGPTLHDP-DLYIEIVKNTKSV---PEYSEVA
650 660 670 680 690
100 110 120 130 140 150
pF1KE6 -DEKVQHIDWTPSCPEPVYI-PTGLETQPLYPDSKEATVVYLAEDAYKEPCFVYSRVGGN
. :: : ::. : :.. . : .. ... .. . ::. . :
CCDS75 YPDYFGHIP--PPFKEPILERPYGVQRTKIAQDIER--LIHQSDIIDR---VVYDLDNPN
700 710 720 730 740 750
160 170 180 190 200 210
pF1KE6 RTPLKQPVDYRDNTLMFEARFESGNLQKVVKVAEYEYQLTVRPDLFTNKHTQWYYFQVTN
: . . . : :...::::::.::... . ::.: . :. .:.. ::.::.:..
CCDS75 YT-----IPEEGDILKFNSKFESGNLRKVIQIRKNEYDLILNSDINSNHYHQWFYFEVSG
760 770 780 790 800
220 230 240 250 260
pF1KE6 MRAGIVYRFTIVNFTKPASLYSRGMRPLFYSEKEAKAHHIGWQRIGDQIKYYRNN-----
:: :..:::.:.: : : .. ::.::.:: .:: . : :.: .: ::.:.
CCDS75 MRPGVAYRFNIINCEKSNSQFNYGMQPLMYSVQEALNARPWWIRMGTDICYYKNHFSRSS
810 820 830 840 850 860
270 280 290 300 310 320
pF1KE6 ---PGQDGRHYFSLTWTFQFPHNKDTCYFAHCYPYTYTNLQEYLSGINN--DPVRSKFCK
:: :. :...:.: .:::. :.::::. :::::..:: .:. ... .: . : :
CCDS75 VAAGGQKGKSYYTITFTVNFPHKDDVCYFAYHYPYTYSTLQMHLQKLESAHNPQQIYFRK
870 880 890 900 910 920
330 340 350 360 370
pF1KE6 IRVLCHTLARNMVYILTITT-PLKN-----SDSRKRKAVILTARVHPGETNSSWIMKGFL
:::.::. : ..:::. : .: :.: :.:.:::::::::.::.::: :
CCDS75 -DVLCETLSGNSCPLVTITAMPESNYYEHICHFRNRPYVFLSARVHPGETNASWVMKGTL
930 940 950 960 970 980
380 390 400 410 420 430
pF1KE6 DYILGNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGRDLNRNYTSLLKESFPSVW
.:...:. :: ::....::.:::::::::: ::.::::.:.::::.. : . :...
CCDS75 EYLMSNNPTAQSLRESYIFKIVPMLNPDGVINGNHRCSLSGEDLNRQWQSPSPDLHPTIY
990 1000 1010 1020 1030 1040
440 450 460 470 480
pF1KE6 YTRNMVHRLME-KREVILYCDLHGHSRKENIFMYGCD-------GSDRSKTLYLQQ----
....... : :: ..::: ::::::.:.:::::. .: . . . .
CCDS75 HAKGLLQYLAAVKRLPLVYCDYHGHSRKKNVFMYGCSIKETVWHTNDNATSCDVVEDTGY
1050 1060 1070 1080 1090 1100
490 500 510 520 530 540
pF1KE6 RIFPLMLSKNCPDKFSFSACKFNVQKSKEGTGRVVMWK-MGIRNSFTMEATFCGSTLGNK
: .: .::. : : .:.:.: :.::::.:.:::.:. .:.. :.:::.:.:: :.
CCDS75 RTLPKILSHIAP-AFCMSSCSFVVEKSKESTARVVVWREIGVQRSYTMESTLCGCDQGKY
1110 1120 1130 1140 1150 1160
550 560 570 580 590 600
pF1KE6 RGTHFSTKDLESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMERHITLEKVFEDSDTPVI
.: ...:..:: :: .:: .::
CCDS75 KGLQIGTRELEEMGAKFCVGLLRLKRLTSPLEYNLPSSLLDFENDLIESSCKVTSPTTYV
1170 1180 1190 1200 1210 1220
>>CCDS44137.1 AGBL4 gene_id:84871|Hs108|chr1 (503 aa)
initn: 662 init1: 342 opt: 627 Z-score: 755.2 bits: 149.6 E(32554): 9.6e-36
Smith-Waterman score: 845; 35.0% identity (65.0% similar) in 429 aa overlap (151-569:21-437)
130 140 150 160 170
pF1KE6 TQPLYPDSKEATVVYLAEDAYKEPCFVYSRVGGNRTP-LKQPVDY----RDNTLMFEARF
.::: . . :. : . . :.:.: :
CCDS44 MAEGSQSAPEAGNDMGNDDAIGGNVSKYIVLPTGYCGQPKKGHLIFDACF
10 20 30 40 50
180 190 200 210 220 230
pF1KE6 ESGNLQKVVKVAEYEYQLTVRPDLFTNKHTQWYYFQVTNMRAGIVYRFTIVNFTKPASLY
::::: .: .:.:.::.: .::: . . :. : : :.. . :.::::.: :::
CCDS44 ESGNLGRVDQVSEFEYDLFIRPDTCNPRFRVWFNFTVENVKESQRVIFNIVNFSKTKSLY
60 70 80 90 100 110
240 250 260 270 280 290
pF1KE6 SRGMRPLFYSEKEAKAHHIGWQRIGDQIKYYRNNPGQDGRHYFSLTWTFQFPHNKDTCYF
:: :. : .. : :::. . :: : : :. . ....: : ...: :
CCDS44 RDGMAPMVKSTSRPK-----WQRLPPKNVYYYRCP--DHRKNYVMSFAFCFDREEDIYQF
120 130 140 150 160
300 310 320 330 340 350
pF1KE6 AHCYPYTYTNLQEYLSGINNDPVRSKFCKIRVLCHTLARNMVYILTITTPLKNSDSRKRK
:.::::::: .:.::..... . . : . . : ... . . .::::.: . .. ..:
CCDS44 AYCYPYTYTRFQHYLDSLQKRNM-DYFFREQ-LGQSVQQRKLDLLTITSPDNLREGAEQK
170 180 190 200 210 220
360 370 380 390 400 410
pF1KE6 AVILTARVHPGETNSSWIMKGFLDYILGNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRC
.:..:.::::::: ::.. .:..:..... : .::. .:::..:::::::: .:::::
CCDS44 VVFITGRVHPGETPSSFVCQGIIDFLVSQHPIACVLREYLVFKIAPMLNPDGVYLGNYRC
230 240 250 260 270 280
420 430 440 450 460 470
pF1KE6 SLAGRDLNRNYTSLLKESFPSVWYTRNMVHRLME--KREVILYCDLHGHSRKENIFMYGC
:: : ::::.. . :.. ..... .... : . .: :.:.:: : ::::
CCDS44 SLMGFDLNRHWLDPSPWVHPTLHGVKQLIVQMYNDPKTSLEFYIDIHAHSTMMNGFMYGN
290 300 310 320 330 340
480 490 500 510 520 530
pF1KE6 DGSDRSKTLYLQQRIFPLMLSKNCPDKFSFSACKFNVQKSKEGTGRVVMWKMGIRNSF--
:. . . .: ::: .: .: : ::.:. .:: . : :::: . . ..:.
CCDS44 IFEDEER--FQRQAIFPKLLCQNAED-FSYSSTSFNRDAVKAGTGRRFLGGLLDHTSYCY
350 360 370 380 390
540 550 560 570 580 590
pF1KE6 TMEATFCGSTL-GNKRGTHFSTKDLESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMERH
:.:..: . . :. .. .. . ..: . ..:::
CCDS44 TLEVSFYSYIISGTTAAVPYTEEAYMKLGRNVARTFLDYYRLNPVVEKVAIPMPRLRNKE
400 410 420 430 440 450
600 610 620
pF1KE6 ITLEKVFEDSDTPVIDITLDVESRELTFLLR
CCDS44 IEVQRRKEKSPPYKHPLLRGPASNYPNSKGDKKSSVNHKDPSTPF
460 470 480 490 500
>>CCDS58398.1 AGBL1 gene_id:123624|Hs108|chr15 (1066 aa)
initn: 1048 init1: 341 opt: 494 Z-score: 589.6 bits: 120.0 E(32554): 1.6e-26
Smith-Waterman score: 1161; 37.7% identity (66.1% similar) in 528 aa overlap (95-567:478-994)
70 80 90 100 110 120
pF1KE6 WVPRLREPRDLYGVSSSGPLSPTRWPYHCEVIDEKVQHI-DWTPSCPEPVYIPTGLETQP
:.: :.. . : :: :. :::
CCDS58 VIDKLLQTHLKRVPFHDPYLYMAKARRTSSVVDFKMMAFPDVWGHCPPPT-------TQP
450 460 470 480 490 500
130 140 150 160 170
pF1KE6 LYPDSKEATVVYLAEDAYK--EPCFVYSRVGGNRTPLKQPVDYRDNT---LMFEARFESG
. . . . . :: . .: : ..: : .: .::. : : ..::::
CCDS58 MLERKCGVQRIRIFEDIRRLIQPSDVINKV---VFSLDEPWPLQDNASNCLRFFSKFESG
510 520 530 540 550
180 190 200 210 220 230
pF1KE6 NLQKVVKVAEYEYQLTVRPDLFTNKHTQWYYFQVTNMRAGIVYRFTIVNFTKPASLYSRG
::.:...: :.::.: : :. ...: ::.::.:..:.:.: :.:.:.: :: : .. :
CCDS58 NLRKAIQVREFEYDLLVNADVNSTQHQQWFYFKVSGMQAAIPYHFNIINCEKPNSQFNYG
560 570 580 590 600 610
240 250 260 270 280 290
pF1KE6 MRPLFYSEKEAKAHHIGWQRIGDQIKYYRNN--------PGQDGRHYFSLTWTFQFPHNK
:.: .:: ::: . : : : .: ::.:. : .:. :..::.. :::..
CCDS58 MQPTLYSVKEALLGKPTWIRTGHEICYYKNHYRQSTAVAGGASGKCYYTLTFAVTFPHSE
620 630 640 650 660 670
300 310 320 330 340
pF1KE6 DTCYFAHCYPYTYTNLQEYLSGINND-PVRSKFCKIRVLCHTLARNMVYILTITT-PLKN
:.::.:. :::::: :. .:. .... .. . . :::.::. : ..:::. : .:
CCDS58 DVCYLAYHYPYTYTALMTHLDILEKSVNLKEVYFRQDVLCQTLGGNPCPLVTITAMPESN
680 690 700 710 720 730
350 360 370 380 390 400
pF1KE6 SDS-----RKRKAVILTARVHPGETNSSWIMKGFLDYILGNSSDAQLLRDTFVFKVVPML
:: :.: ..::::::::.:.::.::: :....... :.:::..:.::..:::
CCDS58 SDEHLEQFRHRPYQVITARVHPGESNASWVMKGTLEFLVSSDPVARLLRENFIFKIIPML
740 750 760 770 780 790
410 420 430 440 450 460
pF1KE6 NPDGVIVGNYRCSLAGRDLNRNYTSLLKESFPSVWYTRNMVHRLME-KREVILYCDLHGH
:::::: ::.::::.:.::::.. : . :...........: : ...::.:::
CCDS58 NPDGVINGNHRCSLSGEDLNRQWLSPSAHLQPTIYHAKGLLYHLSSIGRSPVVFCDFHGH
800 810 820 830 840 850
470 480 490 500 510
pF1KE6 SRKENIFMYGCDGSDR--------SKTLYLQQ---RIFPLMLSKNCPDKFSFSACKFNVQ
:.:.:.:.:::. .. . . :.. : .: .:.: : :..:.:.: :.
CCDS58 SQKKNVFLYGCSIKETLWQAACTVGTSTILEEVNYRTLPKILDKLAP-AFTMSSCSFLVE
860 870 880 890 900 910
520 530 540
pF1KE6 KSKEGTGRVVMWK-MGIRNSFTMEATFCGSTLG-------------NKR--------GTH
::. .:.:::.:. ::. :.:::...:: . : :.: : .
CCDS58 KSRASTARVVVWREMGVSRSYTMESSYCGCNQGPYQCTQRLLERTKNERAHPVDGLQGLQ
920 930 940 950 960 970
550 560 570 580 590 600
pF1KE6 FSTKDLESMGYHFCDSLLDYCDPDRTKYYRCLKELEEMERHITLEKVFEDSDTPVIDITL
:.:..:: :: :: .::
CCDS58 FGTRELEEMGAMFCLGLLILELKSASCSHQLLAQAATLLSAEEDALDQHLQRLKSSNFLP
980 990 1000 1010 1020 1030
>>CCDS42665.1 AGBL5 gene_id:60509|Hs108|chr2 (717 aa)
initn: 578 init1: 165 opt: 282 Z-score: 336.0 bits: 72.5 E(32554): 2.1e-12
Smith-Waterman score: 488; 27.8% identity (50.2% similar) in 532 aa overlap (162-537:1-519)
140 150 160 170 180
pF1KE6 TVVYLAEDAYKEPCFVYSRVGGNRTPLKQPVDYRDNTLMFEARFESGNLQKVVKVA----
.. : . :.: .::.:::: .: ::
CCDS42 MELRCGGLLFSSRFDSGNLAHVEKVESLSS
10 20 30
190 200 210 220
pF1KE6 --------------------EYEYQLTVRPDL----FTNKHTQWYYFQVTNMRAGIVYRF
.::... .::: : : . .:.::.: . : . ..
CCDS42 DGEGVGGGASALTSGIASSPDYEFNVWTRPDCAETEFENGNRSWFYFSVRGGMPGKLIKI
40 50 60 70 80 90
230 240 250 260 270 280
pF1KE6 TIVNFTKPASLYSRGMRPLFYSEKEAKAHHIGWQRIGDQIKYYRNNPGQDGRHYFSLTWT
.:.:..: ..:::.:: : : .. . :.:: :. . .. : :...
CCDS42 NIMNMNKQSKLYSQGMAP-FVRTLPTRPR---WERIRDRPTFEMTET------QFVLSFV
100 110 120 130 140
290 300 310 320 330
pF1KE6 FQFPHNKD-TCYFAHCYPYTYTNLQEYLSGIN-----NDPVRSK-----FCKIRVLCHTL
.: ... : .:: :::..:.. :: :. .. : :..:. . . ..::..:
CCDS42 HRFVEGRGATTFFAFCYPFSYSDCQELLNQLDQRFPENHPTHSSPLDTIYYHRELLCYSL
150 160 170 180 190 200
340 350 360 370
pF1KE6 ARNMVYILTITTPLKNSDSRK--------------------RKAVILTARVHPGETNSSW
: .::::. ..:. .. .:..::::::: ::.
CCDS42 DGLRVDLLTITSCHGLREDREPRLEQLFPDTSTPRPFRFAGKRIFFLSSRVHPGETPSSF
210 220 230 240 250 260
380 390 400 410 420
pF1KE6 IMKGFLDYIL-GNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGRDLNRNY-----
...::::.:: .. :: :: ::::..::::::::. :.:: . : .:::.:
CCDS42 VFNGFLDFILRPDDPRAQTLRRLFVFKLIPMLNPDGVVRGHYRTDSRGVNLNRQYLKPDA
270 280 290 300 310 320
430
pF1KE6 --------------------------------TSLL------------------------
.: :
CCDS42 VLHPAIYGAKAVLLYHHVHSRLNSQSSSEHQPSSCLPPDAPVSDLEKANNLQNEAQCGHS
330 340 350 360 370 380
440 450 460
pF1KE6 ---------KESFP------SVWYTRNMVHRLMEK-------RE--VILYCDLHGHSRKE
:.. : ::: .. : :. .: : : :::::. :.
CCDS42 ADRHNAEAWKQTEPAEQKLNSVWIMPQQSAGLEESAPDTIPPKESGVAYYVDLHGHASKR
390 400 410 420 430 440
470 480 490 500 510
pF1KE6 NIFMYGCDGSDRSKTLYLQQRIFPLMLSKNCPDKFSFSACKFNVQ----------KSKEG
. :::: . ::.: . .. ..: ..: : .:.:..:.:. . .::::
CCDS42 GCFMYGNSFSDESTQV--ENMLYPKLISLNSA-HFDFQGCNFSEKNMYARDRRDGQSKEG
450 460 470 480 490
520 530 540 550 560 570
pF1KE6 TGRVVMWKM-GIRNSFTMEATFCGSTLGNKRGTHFSTKDLESMGYHFCDSLLDYCDPDRT
.:::...: :: .:.:.: ..
CCDS42 SGRVAIYKASGIIHSYTLECNYNTGRSVNSIPAACHDNGRASPPPPPAFPSRYTVELFEQ
500 510 520 530 540 550
>>CCDS1732.3 AGBL5 gene_id:60509|Hs108|chr2 (886 aa)
initn: 508 init1: 165 opt: 282 Z-score: 334.7 bits: 72.6 E(32554): 2.5e-12
Smith-Waterman score: 488; 27.8% identity (50.2% similar) in 532 aa overlap (162-537:1-519)
140 150 160 170 180
pF1KE6 TVVYLAEDAYKEPCFVYSRVGGNRTPLKQPVDYRDNTLMFEARFESGNLQKVVKVA----
.. : . :.: .::.:::: .: ::
CCDS17 MELRCGGLLFSSRFDSGNLAHVEKVESLSS
10 20 30
190 200 210 220
pF1KE6 --------------------EYEYQLTVRPDL----FTNKHTQWYYFQVTNMRAGIVYRF
.::... .::: : : . .:.::.: . : . ..
CCDS17 DGEGVGGGASALTSGIASSPDYEFNVWTRPDCAETEFENGNRSWFYFSVRGGMPGKLIKI
40 50 60 70 80 90
230 240 250 260 270 280
pF1KE6 TIVNFTKPASLYSRGMRPLFYSEKEAKAHHIGWQRIGDQIKYYRNNPGQDGRHYFSLTWT
.:.:..: ..:::.:: : : .. . :.:: :. . .. : :...
CCDS17 NIMNMNKQSKLYSQGMAP-FVRTLPTRPR---WERIRDRPTFEMTET------QFVLSFV
100 110 120 130 140
290 300 310 320 330
pF1KE6 FQFPHNKD-TCYFAHCYPYTYTNLQEYLSGIN-----NDPVRSK-----FCKIRVLCHTL
.: ... : .:: :::..:.. :: :. .. : :..:. . . ..::..:
CCDS17 HRFVEGRGATTFFAFCYPFSYSDCQELLNQLDQRFPENHPTHSSPLDTIYYHRELLCYSL
150 160 170 180 190 200
340 350 360 370
pF1KE6 ARNMVYILTITTPLKNSDSRK--------------------RKAVILTARVHPGETNSSW
: .::::. ..:. .. .:..::::::: ::.
CCDS17 DGLRVDLLTITSCHGLREDREPRLEQLFPDTSTPRPFRFAGKRIFFLSSRVHPGETPSSF
210 220 230 240 250 260
380 390 400 410 420
pF1KE6 IMKGFLDYIL-GNSSDAQLLRDTFVFKVVPMLNPDGVIVGNYRCSLAGRDLNRNY-----
...::::.:: .. :: :: ::::..::::::::. :.:: . : .:::.:
CCDS17 VFNGFLDFILRPDDPRAQTLRRLFVFKLIPMLNPDGVVRGHYRTDSRGVNLNRQYLKPDA
270 280 290 300 310 320
430
pF1KE6 --------------------------------TSLL------------------------
.: :
CCDS17 VLHPAIYGAKAVLLYHHVHSRLNSQSSSEHQPSSCLPPDAPVSDLEKANNLQNEAQCGHS
330 340 350 360 370 380
440 450 460
pF1KE6 ---------KESFP------SVWYTRNMVHRLMEK-------RE--VILYCDLHGHSRKE
:.. : ::: .. : :. .: : : :::::. :.
CCDS17 ADRHNAEAWKQTEPAEQKLNSVWIMPQQSAGLEESAPDTIPPKESGVAYYVDLHGHASKR
390 400 410 420 430 440
470 480 490 500 510
pF1KE6 NIFMYGCDGSDRSKTLYLQQRIFPLMLSKNCPDKFSFSACKFNVQ----------KSKEG
. :::: . ::.: . .. ..: ..: : .:.:..:.:. . .::::
CCDS17 GCFMYGNSFSDESTQV--ENMLYPKLISLNSA-HFDFQGCNFSEKNMYARDRRDGQSKEG
450 460 470 480 490
520 530 540 550 560 570
pF1KE6 TGRVVMWKM-GIRNSFTMEATFCGSTLGNKRGTHFSTKDLESMGYHFCDSLLDYCDPDRT
.:::...: :: .:.:.: ..
CCDS17 SGRVAIYKASGIIHSYTLECNYNTGRSVNSIPAACHDNGRASPPPPPAFPSRYTVELFEQ
500 510 520 530 540 550
621 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 13:45:02 2016 done: Tue Nov 8 13:45:02 2016
Total Scan time: 2.300 Total Display time: 0.090
Function used was FASTA [36.3.4 Apr, 2011]