FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDB0010, 619 aa
1>>>pF1KSDB0010 619 - 619 aa - 619 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 7.7478+/-0.000774; mu= 10.1218+/- 0.047
mean_var=165.8454+/-32.755, 0's: 0 Z-trim(114.5): 78 B-trim: 143 in 1/53
Lambda= 0.099592
statistics sampled from 14945 (15025) to 14945 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.774), E-opt: 0.2 (0.462), width: 16
Scan time: 4.300
The best scores are: opt bits E(32554)
CCDS44931.1 ARHGEF25 gene_id:115557|Hs108|chr12 ( 619) 4197 614.9 9.8e-176
CCDS8947.1 ARHGEF25 gene_id:115557|Hs108|chr12 ( 580) 3694 542.6 5.3e-154
CCDS3883.1 TRIO gene_id:7204|Hs108|chr5 (3097) 1594 241.4 1.3e-62
CCDS3028.1 KALRN gene_id:8997|Hs108|chr3 (1289) 1252 192.0 4.1e-48
CCDS34124.1 PLEKHG4B gene_id:153478|Hs108|chr5 (1271) 662 107.2 1.3e-22
CCDS81782.1 MCF2L gene_id:23263|Hs108|chr13 ( 984) 658 106.6 1.6e-22
CCDS9527.3 MCF2L gene_id:23263|Hs108|chr13 (1123) 658 106.6 1.8e-22
CCDS45070.2 MCF2L gene_id:23263|Hs108|chr13 (1125) 658 106.6 1.8e-22
CCDS55514.1 MCF2 gene_id:4168|Hs108|chrX ( 821) 631 102.6 2.1e-21
CCDS55515.1 MCF2 gene_id:4168|Hs108|chrX ( 860) 631 102.7 2.2e-21
CCDS14667.1 MCF2 gene_id:4168|Hs108|chrX ( 925) 631 102.7 2.3e-21
CCDS55516.1 MCF2 gene_id:4168|Hs108|chrX ( 941) 631 102.7 2.3e-21
CCDS48175.1 MCF2 gene_id:4168|Hs108|chrX ( 985) 631 102.7 2.4e-21
CCDS55517.1 MCF2 gene_id:4168|Hs108|chrX (1001) 631 102.7 2.4e-21
CCDS82829.1 KALRN gene_id:8997|Hs108|chr3 (1654) 617 100.9 1.4e-20
CCDS3027.1 KALRN gene_id:8997|Hs108|chr3 (1663) 617 100.9 1.5e-20
CCDS45512.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1110) 507 84.9 6.1e-16
CCDS32466.1 PLEKHG4 gene_id:25894|Hs108|chr16 (1191) 507 84.9 6.4e-16
CCDS34552.1 PLEKHG1 gene_id:57480|Hs108|chr6 (1385) 399 69.5 3.4e-11
CCDS76690.1 PLEKHG3 gene_id:26030|Hs108|chr14 (1219) 390 68.1 7.5e-11
>>CCDS44931.1 ARHGEF25 gene_id:115557|Hs108|chr12 (619 aa)
initn: 4197 init1: 4197 opt: 4197 Z-score: 3268.5 bits: 614.9 E(32554): 9.8e-176
Smith-Waterman score: 4197; 99.8% identity (100.0% similar) in 619 aa overlap (1-619:1-619)
10 20 30 40 50 60
pF1KSD MKPPDRPAPGRTDRILGVMGGMLRACALPGQEGPPRRSPLGLVGTEPESERTEGDHRRDR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 MKPPDRPAPGRTDRILGVMGGMLRACALPGQEGPPRRSPLGLVGTEPESERTEGDHRRDR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD EHEVLAGALQPESYSIAGSEGSISASAASGLAAPSGPSSGLSSGPCSPGPPGPVSGLRRW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EHEVLAGALQPESYSIAGSEGSISASAASGLAAPSGPSSGLSSGPCSPGPPGPVSGLRRW
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD LDHSKHCLSVETEADSGQAGPYENWMLEPALATGEELPELTLLTTLLEGPGDKTQPPEEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 LDHSKHCLSVETEADSGQAGPYENWMLEPALATGEELPELTLLTTLLEGPGDKTQPPEEE
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD TLSQAPESEEEQKKKALERSMYVLSELVETEKMYVDDLGQIVEGYMATMAAQGVPESLRG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TLSQAPESEEEQKKKALERSMYVLSELVETEKMYVDDLGQIVEGYMATMAAQGVPESLRG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD RDRIVFGNIQQIYEWHRDYFLQELQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 RDRIVFGNIQQIYEWHRDYFLQELQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEH
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD VVSEFGDSYFEELRQQLGHRLQLNDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VVSEFGDSYFEELRQQLGHRLQLNDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQ
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD AVEVMCFVPKRCNDMMTLGRLRGFEGKLTAQGKLLGQDTFWVTEPEAGGLLSSRGRERRV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 AVEVMCFVPKRCNDMMTLGRLRGFEGKLTAQGKLLGQDTFWVTEPEAGGLLSSRGRERRV
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD FLFEQIIIFSEALGGGVRGGTQPGYVYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FLFEQIIIFSEALGGGVRGGTQPGYVYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGI
430 440 450 460 470 480
490 500 510 520 530 540
pF1KSD QRYVLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQRRESQTNSLGRPRGPGVGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 QRYVLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQRRESQTNSLGRPRGPGVGS
490 500 510 520 530 540
550 560 570 580 590 600
pF1KSD PGRIRLGDQAQGSTHTPINGSLPSLLLSPKGEVARALLPLDKQALGDIPQAPHDSPPVSP
::::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 PGRIQLGDQAQGSTHTPINGSLPSLLLSPKGEVARALLPLDKQALGDIPQAPHDSPPVSP
550 560 570 580 590 600
610
pF1KSD TPKTPPCQARLAKLDEDEL
:::::::::::::::::::
CCDS44 TPKTPPCQARLAKLDEDEL
610
>>CCDS8947.1 ARHGEF25 gene_id:115557|Hs108|chr12 (580 aa)
initn: 3694 init1: 3694 opt: 3694 Z-score: 2878.3 bits: 542.6 E(32554): 5.3e-154
Smith-Waterman score: 3694; 99.8% identity (100.0% similar) in 548 aa overlap (72-619:33-580)
50 60 70 80 90 100
pF1KSD LVGTEPESERTEGDHRRDREHEVLAGALQPESYSIAGSEGSISASAASGLAAPSGPSSGL
::::::::::::::::::::::::::::::
CCDS89 GGHKGGRCACPRVIRKVLAKCGCCFARGGRESYSIAGSEGSISASAASGLAAPSGPSSGL
10 20 30 40 50 60
110 120 130 140 150 160
pF1KSD SSGPCSPGPPGPVSGLRRWLDHSKHCLSVETEADSGQAGPYENWMLEPALATGEELPELT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 SSGPCSPGPPGPVSGLRRWLDHSKHCLSVETEADSGQAGPYENWMLEPALATGEELPELT
70 80 90 100 110 120
170 180 190 200 210 220
pF1KSD LLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKKALERSMYVLSELVETEKMYVDDLGQI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 LLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKKALERSMYVLSELVETEKMYVDDLGQI
130 140 150 160 170 180
230 240 250 260 270 280
pF1KSD VEGYMATMAAQGVPESLRGRDRIVFGNIQQIYEWHRDYFLQELQRCLKDPDWLAQLFIKH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 VEGYMATMAAQGVPESLRGRDRIVFGNIQQIYEWHRDYFLQELQRCLKDPDWLAQLFIKH
190 200 210 220 230 240
290 300 310 320 330 340
pF1KSD ERRLHMYVVYCQNKPKSEHVVSEFGDSYFEELRQQLGHRLQLNDLLIKPVQRIMKYQLLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 ERRLHMYVVYCQNKPKSEHVVSEFGDSYFEELRQQLGHRLQLNDLLIKPVQRIMKYQLLL
250 260 270 280 290 300
350 360 370 380 390 400
pF1KSD KDFLKYYNRAGMDTADLEQAVEVMCFVPKRCNDMMTLGRLRGFEGKLTAQGKLLGQDTFW
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 KDFLKYYNRAGMDTADLEQAVEVMCFVPKRCNDMMTLGRLRGFEGKLTAQGKLLGQDTFW
310 320 330 340 350 360
410 420 430 440 450 460
pF1KSD VTEPEAGGLLSSRGRERRVFLFEQIIIFSEALGGGVRGGTQPGYVYKNSIKVSCLGLEGN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 VTEPEAGGLLSSRGRERRVFLFEQIIIFSEALGGGVRGGTQPGYVYKNSIKVSCLGLEGN
370 380 390 400 410 420
470 480 490 500 510 520
pF1KSD LQGDPCRFALTSRGPEGGIQRYVLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS89 LQGDPCRFALTSRGPEGGIQRYVLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQ
430 440 450 460 470 480
530 540 550 560 570 580
pF1KSD RRESQTNSLGRPRGPGVGSPGRIRLGDQAQGSTHTPINGSLPSLLLSPKGEVARALLPLD
:::::::::::::::::::::::.::::::::::::::::::::::::::::::::::::
CCDS89 RRESQTNSLGRPRGPGVGSPGRIQLGDQAQGSTHTPINGSLPSLLLSPKGEVARALLPLD
490 500 510 520 530 540
590 600 610
pF1KSD KQALGDIPQAPHDSPPVSPTPKTPPCQARLAKLDEDEL
::::::::::::::::::::::::::::::::::::::
CCDS89 KQALGDIPQAPHDSPPVSPTPKTPPCQARLAKLDEDEL
550 560 570 580
>>CCDS3883.1 TRIO gene_id:7204|Hs108|chr5 (3097 aa)
initn: 1396 init1: 1103 opt: 1594 Z-score: 1237.6 bits: 241.4 E(32554): 1.3e-62
Smith-Waterman score: 1612; 47.6% identity (72.7% similar) in 582 aa overlap (51-606:1807-2378)
30 40 50 60 70
pF1KSD GMLRACALPGQEGPPRRSPLGLVGTEPESERTEGDHRRDREHEVLAGALQPESYSIAG--
: .: ... . :.. : :. :
CCDS38 LTSPVRRLSSGKADGHVKKLAHKHKKSREVRKSADAGSQKDSDDSAATPQDETVEERGRN
1780 1790 1800 1810 1820 1830
80 90 100 110 120
pF1KSD ---SEGSISASAASGLAAPSGPSSGLSSGPCSPGPPGPVSGLRRWL-------DHSKHCL
: :..: :..::. . : : .. : :: :.. .. : :... :
CCDS38 EGLSSGTLSKSSSSGMQS-CGEEEGEEGADAVPLPP-PMAIQQHSLLQPDSQDDKASSRL
1840 1850 1860 1870 1880 1890
130 140 150 160 170 180
pF1KSD SVE-TEADSGQAGPYENWMLEPALATGEELPELTLLTTLLEGPGDKTQP---PEEETL--
:. : ... .:. . .: . . : . ..:: ::...: : ...:
CCDS38 LVRPTSSETPSAAELVS-AIEELVKSKMALEDRP--SSLLVDQGDSSSPSFNPSDNSLLS
1900 1910 1920 1930 1940 1950
190 200 210 220 230 240
pF1KSD SQAPESE-EEQKKKALERSMYVLSELVETEKMYVDDLGQIVEGYMATMAAQGVPESLRGR
:..: .: ::.:...:.: :::.::::::. :: ::: .:::::: : .:::....:.
CCDS38 SSSPIDEMEERKSSSLKRRHYVLQELVETERDYVRDLGYVVEGYMALMKEDGVPDDMKGK
1960 1970 1980 1990 2000 2010
250 260 270 280 290 300
pF1KSD DRIVFGNIQQIYEWHRDYFLQELQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEHV
:.::::::.:::.::::.:: ::..::.::. :..::.:::::::::..::::::::::.
CCDS38 DKIVFGNIHQIYDWHRDFFLGELEKCLEDPEKLGSLFVKHERRLHMYIAYCQNKPKSEHI
2020 2030 2040 2050 2060 2070
310 320 330 340 350 360
pF1KSD VSEFGDSYFEELRQQLGHRLQLNDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQA
:::. :..::.:.:.:::::::.::::::::::::::::::::::: ..:..::..::.:
CCDS38 VSEYIDTFFEDLKQRLGHRLQLTDLLIKPVQRIMKYQLLLKDFLKYSKKASLDTSELERA
2080 2090 2100 2110 2120 2130
370 380 390 400 410 420
pF1KSD VEVMCFVPKRCNDMMTLGRLRGFEGKLTAQGKLLGQDTFWVTEPEAGGLLSSRGRERRVF
:::::.::.::::::..:::.::.::..:::::: :::: ::. .:: : : ::::.:
CCDS38 VEVMCIVPRRCNDMMNVGRLQGFDGKIVAQGKLLLQDTFLVTDQDAG--LLPRCRERRIF
2140 2150 2160 2170 2180
430 440 450 460 470 480
pF1KSD LFEQIIIFSEALGGGVRGGTQPGYVYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGIQ
:::::.:::: : .: ..::...::::::::: :: :...:::.:::::: . ..
CCDS38 LFEQIVIFSEPLDKK-KGFSMPGFLFKNSIKVSCLCLEENVENDPCKFALTSRTGDV-VE
2190 2200 2210 2220 2230 2240
490 500 510 520 530 540
pF1KSD RYVLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQRRESQTNSLGRPRGPGVGSP
..:....:.. :.::... ::::.::.::::: ::::::: .: .. : : : :.
CCDS38 TFILHSSSPSVRQTWIHEINQILENQRNFLNALTSPIEYQRNHSGGGGGGGSGGSG-GGG
2250 2260 2270 2280 2290 2300
550 560 570 580 590
pF1KSD GRIRLGDQAQGSTHT--PIN-GSLPSLLLSPKGEV---ARALLP-LDKQALGDIPQAPHD
: : . :: :. : . :. :: : ... .: : : ..: .. .: .
CCDS38 GSGGGGAPSGGSGHSGGPSSCGGAPSTSRSRPSRIPQPVRHHPPVLVSSAASSQAEADKM
2310 2320 2330 2340 2350 2360
600 610
pF1KSD SPPVSPTPKTPPCQARLAKLDEDEL
: .: :. ::
CCDS38 SGTSTPGPSLPPPGAAPEAGPSAPSRRPPGADAEGSEREAEPIPKMKVLESPRKGAANAS
2370 2380 2390 2400 2410 2420
>--
initn: 739 init1: 317 opt: 806 Z-score: 625.7 bits: 128.2 E(32554): 1.6e-28
Smith-Waterman score: 806; 32.3% identity (65.1% similar) in 455 aa overlap (176-607:1269-1713)
150 160 170 180 190 200
pF1KSD MLEPALATGEELPELTLLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKKALERSMYVLS
: : : .: . .:.:.:. .:. ....
CCDS38 RTSLEKALGISSDSNKSSKSLQLDIIPASIPGSEVKLRDAAHELNEEKRKSARRKEFIMA
1240 1250 1260 1270 1280 1290
210 220 230 240 250 260
pF1KSD ELVETEKMYVDDLGQIVEGYMATMAA--QGVPESLRGRDRIVFGNIQQIYEWHRDYFLQE
::..::: :: :: . .. :. :.. . .: .. ... :.:::.:.:::.: . ::.:
CCDS38 ELIQTEKAYVRDLRECMDTYLWEMTSGVEEIPPGIVNKELIIFGNMQEIYEFHNNIFLKE
1300 1310 1320 1330 1340 1350
270 280 290 300 310 320
pF1KSD LQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEHVVSEFGDSYFEELRQQLGHRLQL
:.. . :. ... :. ...:::.::.::: : ... : . :::.:..:. : ..
CCDS38 LEKYEQLPEDVGHCFVTWADKFQMYVTYCKNKPDSTQLILEHAGSYFDEIQQRHGLANSI
1360 1370 1380 1390 1400 1410
330 340 350 360 370 380
pF1KSD NDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQAVEVMCFVPKRCNDMMTLGRLRG
.. :::::::: :::::::..: ... .......::: :::: :: : :. :.:
CCDS38 SSYLIKPVQRITKYQLLLKELLTCCEEG---KGEIKDGLEVMLSVPKRANDAMHLSMLEG
1420 1430 1440 1450 1460 1470
390 400 410 420 430 440
pF1KSD FEGKLTAQGKLLGQDTFWVTEPEAGGLLSSRGRERRVFLFEQIIIFSEALGGGVRGGTQP
:. .. .::.:. :..: : .:.. : .::::..::::. ..::. . . : ..
CCDS38 FDENIESQGELILQESFQVWDPKT---LIRKGRERHLFLFEMSLVFSKEVKDS-SGRSK-
1480 1490 1500 1510 1520 1530
450 460 470 480 490 500
pF1KSD GYVYKNSIKVSCLGLEGNLQGDPCRFAL-TSRGPEGGIQRYVLQAADPAISQAWIKHVAQ
:.::... .: ::. ...::::.::: ..: : . .. ::.:.. .: ::::. .
CCDS38 -YLYKSKLFTSELGVTEHVEGDPCKFALWVGRTPTSD-NKIVLKASSIENKQDWIKHIRE
1540 1550 1560 1570 1580
510 520 530 540 550
pF1KSD ILESQRDFLN-ALQSPIEYQRRESQTNSLGR-------PRGPGVGSPGRIRLGDQAQGST
... . :. ::. ::. . : . :: .: : ..: : ...... .:
CCDS38 VIQERTIHLKGALKEPIHIPKTAPATRQKGRRDGEDLDSQGDGSSQPDTISIASRTSQNT
1590 1600 1610 1620 1630 1640
560 570 580 590 600
pF1KSD --HTPINGSLP-SLLLSPKGEVARALLPLDKQALGDIPQAPHDSPP---VSPTPKTP---
..:. .... : . . .. . :::.: : : ..:
CCDS38 LDSDKLSGGCELTVVIHDFTACNSNELTIRRGQTVEVLERPHDKPDWCLVRTTDRSPAAE
1650 1660 1670 1680 1690 1700
610
pF1KSD ---PCQARLAKLDEDEL
::
CCDS38 GLVPCGSLCIAHSRSSMEMEGIFNHKDSLSVSSNDASPPASVASLQPHMIGAQSSPGPKR
1710 1720 1730 1740 1750 1760
>>CCDS3028.1 KALRN gene_id:8997|Hs108|chr3 (1289 aa)
initn: 917 init1: 555 opt: 1252 Z-score: 977.3 bits: 192.0 E(32554): 4.1e-48
Smith-Waterman score: 1462; 57.2% identity (80.0% similar) in 400 aa overlap (176-568:214-595)
150 160 170 180 190 200
pF1KSD MLEPALATGEELPELTLLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKKALERSMYVLS
:: : . :: :::: :::. :.::.
CCDS30 KLVKNKLSLEGSSYRGSLKDPAGCLNEGMAPP---TPPKNPE--EEQKAKALRGRMFVLN
190 200 210 220 230
210 220 230 240 250 260
pF1KSD ELVETEKMYVDDLGQIVEGYMATMAAQGVPESLRGRDRIVFGNIQQIYEWHRDYFLQELQ
:::.::: :: ::: .:::.: . .::::..::.:.::::::.:::.::.:.:: ::.
CCDS30 ELVQTEKDYVKDLGIVVEGFMKRIEEKGVPEDMRGKDKIVFGNIHQIYDWHKDFFLAELE
240 250 260 270 280 290
270 280 290 300 310 320
pF1KSD RCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEHVVSEFGDSYFEELRQQLGHRLQLND
.:... : ::::::::::.::.:: ::::::.::..:.:. :.::::..:....:: :.:
CCDS30 KCIQEQDRLAQLFIKHERKLHIYVWYCQNKPRSEYIVAEY-DAYFEEVKQEINQRLTLSD
300 310 320 330 340 350
330 340 350 360 370 380
pF1KSD LLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQAVEVMCFVPKRCNDMMTLGRLRGFE
.::::.::: ::::::::::.: ..::.. .:.:.:::.::.:::::::::.::::.:::
CCDS30 FLIKPIQRITKYQLLLKDFLRYSEKAGLECSDIEKAVELMCLVPKRCNDMMNLGRLQGFE
360 370 380 390 400 410
390 400 410 420 430 440
pF1KSD GKLTAQGKLLGQDTFWVTEPEAGGLLSSRGRERRVFLFEQIIIFSEALGGGVRGGTQPGY
: :::::::: ::::.: : .:: ..:: .::::::::::.:::: : .:. :::
CCDS30 GTLTAQGKLLQQDTFYVIELDAG--MQSRTKERRVFLFEQIVIFSELLR---KGSLTPGY
420 430 440 450 460 470
450 460 470 480 490 500
pF1KSD VYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGIQRYVLQAADPAISQAWIKHVAQILE
..: :::.. : :: :...:::.::: .: .: :::::. :.:::.. . :.::
CCDS30 MFKRSIKMNYLVLEENVDNDPCKFALMNRETS---ERVVLQAANADIQQAWVQDINQVLE
480 490 500 510 520
510 520 530 540 550
pF1KSD SQRDFLNALQSPIEYQRRESQTNSL-GRP-RGPGVGSP---GRIRLGDQA--QGSTHTPI
.::::::::::::::::.: .: . ..: : : . :: . . :.. .::...:
CCDS30 TQRDFLNALQSPIEYQRKERSTAVMRSQPARLPQA-SPRPYSSVPAGSEKPPKGSSYNP-
530 540 550 560 570 580
560 570 580 590 600 610
pF1KSD NGSLPSLLLSPKGEVARALLPLDKQALGDIPQAPHDSPPVSPTPKTPPCQARLAKLDEDE
:: : .:
CCDS30 --PLPPLKISTSNGSPGFEYHQPGDKFEASKQNDLGGCNGTSSMAVIKDYYALKENEICV
590 600 610 620 630 640
>>CCDS34124.1 PLEKHG4B gene_id:153478|Hs108|chr5 (1271 aa)
initn: 646 init1: 443 opt: 662 Z-score: 519.2 bits: 107.2 E(32554): 1.3e-22
Smith-Waterman score: 689; 28.3% identity (62.4% similar) in 481 aa overlap (90-557:686-1148)
60 70 80 90 100 110
pF1KSD REHEVLAGALQPESYSIAGSEGSISASAASGLAAPSGPSSGL-SSGPCSPGPPGPVSGLR
:: . .. .. : .:. :: : ...
CCDS34 LPGRALLCGQDGETLRPGLCALWDPLSLLRGLPGAGATTAHLEDSSACSSEPTQTLASRP
660 670 680 690 700 710
120 130 140 150 160 170
pF1KSD RWLDHSKHCLSVET-EADSGQAGPYENWMLEPALATGEELPELTLLTTLLEGP--GDKTQ
: ..: .... : . ..:: .. . . . . .. : . ..: . : .
CCDS34 RKHPQKKMIKKTQSFEIPQPDSGPRDSCQPDHTSVFSKGLEVTSTVATEKKLPLWQHARS
720 730 740 750 760 770
180 190 200 210 220
pF1KSD PP--EEETLSQA----PESEEEQKKKALERSMYVLSELVETEKMYVDDLGQIVEGYMATM
:: . ..::. : :. ... . : ....:.. ::. :. :: ....:. :
CCDS34 PPVTQSRSLSSPSGLHPAEEDGRQQVGSSRLRHIMAEMIATEREYIRCLGYVIDNYFPEM
780 790 800 810 820 830
230 240 250 260 270 280
pF1KSD AAQGVPESLRGRDRIVFGNIQQIYEWHRDYFLQELQRCLKDPDWLAQLFIKHERRLHMYV
. .:..:::. ...:::.......:...::.::.:: . : ... :..::... :::
CCDS34 ERMDLPQGLRGKHHVIFGNLEKLHDFHQQHFLRELERCQHCPLAVGRSFLRHEEQFGMYV
840 850 860 870 880 890
290 300 310 320 330 340
pF1KSD VYCQNKPKSEHVVSEFGDSYFEELRQQLGHRLQLNDLLIKPVQRIMKYQLLLKDFLKYYN
.: .:::.:. ..: :...:.. ...:: ...: . :..::::. :: :::.:.:: .
CCDS34 IYSKNKPQSDALLSSHGNAFFKDKQRELGDKMDLASYLLRPVQRVAKYALLLQDLLKEAS
900 910 920 930 940 950
350 360 370 380 390 400
pF1KSD ---RAGMDTADLEQAVEVMCFVPKRCNDMMTLGRLRGFEGKLTAQGKLLGQDTFWVTEPE
:.. ..:. : :.:: .. ::.... .:: . .: ::.: .: : : .
CCDS34 CGLAQGQELGELRAAEVVVCFQLRHGNDLLAMDAIRGCDVNLKEQGQLRCRDEFIVCCGR
960 970 980 990 1000 1010
410 420 430 440 450 460
pF1KSD AGGLLSSRGRERRVFLFEQIIIFSEALGGGVRGGTQPGYVYKNSIKVSCLGLEGNLQGDP
: :.:::::..:.::.. :.: .. :.::.:.:.. .:. :. .
CCDS34 KKYL-------RHVFLFEDLILFSKTQK--VEG-SHDVYLYKQSFKTAEIGMTENVGDSG
1020 1030 1040 1050 1060
470 480 490 500 510 520
pF1KSD CRFALTSRGPEGGIQRYVLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQRRESQ
:: . : . . . :.:::.. ...:: ...:: : ::.: . : ..
CCDS34 LRFEIWFRRRRKSQDTYILQASSAEVKSAWTDVIGRILWRQ-----ALKS---RELRIQE
1070 1080 1090 1100 1110
530 540 550 560 570 580
pF1KSD TNSLGRPRGPGVGSPGRIRLGDQAQGSTHTPINGSLPSLLLSPKGEVARALLPLDKQALG
:.: : . : : : : : ..:
CCDS34 MASMGIGNQPFMDVKPRDRTPDCAVISDRAPKCAVMSDRVPDSIVKGTESQMRGSTAVSS
1120 1130 1140 1150 1160 1170
590 600 610
pF1KSD DIPQAPHDSPPVSPTPKTPPCQARLAKLDEDEL
CCDS34 SDHAAPFKRPHSTISDSSTSSSSSQSSSILGSLGLLVSSSPAHPGLWSPAHSPWSSDIRA
1180 1190 1200 1210 1220 1230
>>CCDS81782.1 MCF2L gene_id:23263|Hs108|chr13 (984 aa)
initn: 386 init1: 246 opt: 658 Z-score: 517.7 bits: 106.6 E(32554): 1.6e-22
Smith-Waterman score: 658; 32.6% identity (64.1% similar) in 390 aa overlap (166-543:567-946)
140 150 160 170 180 190
pF1KSD SGQAGPYENWMLEPALATGEELPELTLLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKK
: .:: ... :. . . ::...
CCDS81 APRPEALAKSPCPSPGIRRGSENSSSEGGALRRGPYRRAKSEMSESRQGRGSAGEEEESL
540 550 560 570 580 590
200 210 220 230 240 250
pF1KSD ALERSMYVLSELVETEKMYVDDLGQIVEGYMATM----AAQGVPESLRGRDRIVFGNIQQ
:. : .:.:::..::. ::..: ..::: : : :. . .:... ..:::...
CCDS81 AILRR-HVMSELLDTERAYVEELLCVLEGYAAEMDNPLMAHLLSTGLHNKKDVLFGNMEE
600 610 620 630 640 650
260 270 280 290 300 310
pF1KSD IYEWHRDYFLQELQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEHVVSEFGDS-YF
::..: ::.::. :. ... :... . ...: ::::::.:: . . .: .:
CCDS81 IYHFHNRIFLRELENYTDCPELVGRCFLERMEDFQIYEKYCQNKPRSESLWRQCSDCPFF
660 670 680 690 700 710
320 330 340 350 360 370
pF1KSD EELRQQLGHRLQLNDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQAVEVMCFVPK
.: ...: :.:.:.. :.:::::: :::::::..::: .: . ::..:. . . :
CCDS81 QECQRKLDHKLSLDSYLLKPVQRITKYQLLLKEMLKY-SRNCEGAEDLQEALSSILGILK
720 730 740 750 760 770
380 390 400 410 420
pF1KSD RCNDMMTLGRLRGFEGKLTAQGKLLGQDTF--WVTEPEAGGLLSSRGR----ERRVFLFE
:: : : . :..:.: :::: : .: :. . .. .. .: .:..:: :
CCDS81 AVNDSMHLIAITGYDGNLGDLGKLLMQGSFSVWTDHKRGHTKVKELARFKPMQRHLFLHE
780 790 800 810 820 830
430 440 450 460 470 480
pF1KSD QIIIFSEALGGGVRGGTQ-PGYVYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGIQRY
. ..: . . .: . :.: ::.:.... .:. :..:: .: . . : . :
CCDS81 KAVLFCKKREENGEGYEKAPSYSYKQSLNMAAVGITENVKGDAKKFEIWYNARE---EVY
840 850 860 870 880 890
490 500 510 520 530 540
pF1KSD VLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQRRESQTNSLGRPRGPGVGSPGR
..:: : :. ::.... ..: :: :.: . ... : :..:: : .: ::.:
CCDS81 IVQAPTPEIKAAWVNEIRKVLTSQ---LQACREASQHRALE-QSQSLPLP-APTSTSPSR
900 910 920 930 940
550 560 570 580 590 600
pF1KSD IRLGDQAQGSTHTPINGSLPSLLLSPKGEVARALLPLDKQALGDIPQAPHDSPPVSPTPK
CCDS81 GNSRNIKKLEERKTDPLSLEGYVSSAPLTKPPEKGKEP
950 960 970 980
>>CCDS9527.3 MCF2L gene_id:23263|Hs108|chr13 (1123 aa)
initn: 386 init1: 246 opt: 658 Z-score: 516.9 bits: 106.6 E(32554): 1.8e-22
Smith-Waterman score: 658; 32.6% identity (64.1% similar) in 390 aa overlap (166-543:567-946)
140 150 160 170 180 190
pF1KSD SGQAGPYENWMLEPALATGEELPELTLLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKK
: .:: ... :. . . ::...
CCDS95 APRPEALAKSPCPSPGIRRGSENSSSEGGALRRGPYRRAKSEMSESRQGRGSAGEEEESL
540 550 560 570 580 590
200 210 220 230 240 250
pF1KSD ALERSMYVLSELVETEKMYVDDLGQIVEGYMATM----AAQGVPESLRGRDRIVFGNIQQ
:. : .:.:::..::. ::..: ..::: : : :. . .:... ..:::...
CCDS95 AILRR-HVMSELLDTERAYVEELLCVLEGYAAEMDNPLMAHLLSTGLHNKKDVLFGNMEE
600 610 620 630 640 650
260 270 280 290 300 310
pF1KSD IYEWHRDYFLQELQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEHVVSEFGDS-YF
::..: ::.::. :. ... :... . ...: ::::::.:: . . .: .:
CCDS95 IYHFHNRIFLRELENYTDCPELVGRCFLERMEDFQIYEKYCQNKPRSESLWRQCSDCPFF
660 670 680 690 700 710
320 330 340 350 360 370
pF1KSD EELRQQLGHRLQLNDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQAVEVMCFVPK
.: ...: :.:.:.. :.:::::: :::::::..::: .: . ::..:. . . :
CCDS95 QECQRKLDHKLSLDSYLLKPVQRITKYQLLLKEMLKY-SRNCEGAEDLQEALSSILGILK
720 730 740 750 760 770
380 390 400 410 420
pF1KSD RCNDMMTLGRLRGFEGKLTAQGKLLGQDTF--WVTEPEAGGLLSSRGR----ERRVFLFE
:: : : . :..:.: :::: : .: :. . .. .. .: .:..:: :
CCDS95 AVNDSMHLIAITGYDGNLGDLGKLLMQGSFSVWTDHKRGHTKVKELARFKPMQRHLFLHE
780 790 800 810 820 830
430 440 450 460 470 480
pF1KSD QIIIFSEALGGGVRGGTQ-PGYVYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGIQRY
. ..: . . .: . :.: ::.:.... .:. :..:: .: . . : . :
CCDS95 KAVLFCKKREENGEGYEKAPSYSYKQSLNMAAVGITENVKGDAKKFEIWYNARE---EVY
840 850 860 870 880 890
490 500 510 520 530 540
pF1KSD VLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQRRESQTNSLGRPRGPGVGSPGR
..:: : :. ::.... ..: :: :.: . ... : :..:: : .: ::.:
CCDS95 IVQAPTPEIKAAWVNEIRKVLTSQ---LQACREASQHRALE-QSQSLPLP-APTSTSPSR
900 910 920 930 940
550 560 570 580 590 600
pF1KSD IRLGDQAQGSTHTPINGSLPSLLLSPKGEVARALLPLDKQALGDIPQAPHDSPPVSPTPK
CCDS95 GNSRNIKKLEERKTDPLSLEGYVSSAPLTKPPEKGKGWSKTSHSLEAPEDDGGWSSAEEQ
950 960 970 980 990 1000
>>CCDS45070.2 MCF2L gene_id:23263|Hs108|chr13 (1125 aa)
initn: 386 init1: 246 opt: 658 Z-score: 516.8 bits: 106.6 E(32554): 1.8e-22
Smith-Waterman score: 658; 32.6% identity (64.1% similar) in 390 aa overlap (166-543:569-948)
140 150 160 170 180 190
pF1KSD SGQAGPYENWMLEPALATGEELPELTLLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKK
: .:: ... :. . . ::...
CCDS45 APRPEALAKSPCPSPGIRRGSENSSSEGGALRRGPYRRAKSEMSESRQGRGSAGEEEESL
540 550 560 570 580 590
200 210 220 230 240 250
pF1KSD ALERSMYVLSELVETEKMYVDDLGQIVEGYMATM----AAQGVPESLRGRDRIVFGNIQQ
:. : .:.:::..::. ::..: ..::: : : :. . .:... ..:::...
CCDS45 AILRR-HVMSELLDTERAYVEELLCVLEGYAAEMDNPLMAHLLSTGLHNKKDVLFGNMEE
600 610 620 630 640 650
260 270 280 290 300 310
pF1KSD IYEWHRDYFLQELQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEHVVSEFGDS-YF
::..: ::.::. :. ... :... . ...: ::::::.:: . . .: .:
CCDS45 IYHFHNRIFLRELENYTDCPELVGRCFLERMEDFQIYEKYCQNKPRSESLWRQCSDCPFF
660 670 680 690 700 710
320 330 340 350 360 370
pF1KSD EELRQQLGHRLQLNDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQAVEVMCFVPK
.: ...: :.:.:.. :.:::::: :::::::..::: .: . ::..:. . . :
CCDS45 QECQRKLDHKLSLDSYLLKPVQRITKYQLLLKEMLKY-SRNCEGAEDLQEALSSILGILK
720 730 740 750 760 770
380 390 400 410 420
pF1KSD RCNDMMTLGRLRGFEGKLTAQGKLLGQDTF--WVTEPEAGGLLSSRGR----ERRVFLFE
:: : : . :..:.: :::: : .: :. . .. .. .: .:..:: :
CCDS45 AVNDSMHLIAITGYDGNLGDLGKLLMQGSFSVWTDHKRGHTKVKELARFKPMQRHLFLHE
780 790 800 810 820 830
430 440 450 460 470 480
pF1KSD QIIIFSEALGGGVRGGTQ-PGYVYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGIQRY
. ..: . . .: . :.: ::.:.... .:. :..:: .: . . : . :
CCDS45 KAVLFCKKREENGEGYEKAPSYSYKQSLNMAAVGITENVKGDAKKFEIWYNARE---EVY
840 850 860 870 880 890
490 500 510 520 530 540
pF1KSD VLQAADPAISQAWIKHVAQILESQRDFLNALQSPIEYQRRESQTNSLGRPRGPGVGSPGR
..:: : :. ::.... ..: :: :.: . ... : :..:: : .: ::.:
CCDS45 IVQAPTPEIKAAWVNEIRKVLTSQ---LQACREASQHRALE-QSQSLPLP-APTSTSPSR
900 910 920 930 940
550 560 570 580 590 600
pF1KSD IRLGDQAQGSTHTPINGSLPSLLLSPKGEVARALLPLDKQALGDIPQAPHDSPPVSPTPK
CCDS45 GNSRNIKKLEERKTDPLSLEGYVSSAPLTKPPEKGKGWSKTSHSLEAPEDDGGWSSAEEQ
950 960 970 980 990 1000
>>CCDS55514.1 MCF2 gene_id:4168|Hs108|chrX (821 aa)
initn: 520 init1: 266 opt: 631 Z-score: 497.8 bits: 102.6 E(32554): 2.1e-21
Smith-Waterman score: 631; 31.6% identity (65.1% similar) in 361 aa overlap (176-524:433-789)
150 160 170 180 190 200
pF1KSD MLEPALATGEELPELTLLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKKALERSMYVLS
: .: :..: : .. .. . .::.
CCDS55 LVTSGTPFFSSKQGKKTWRQNQSNLKIEVVPDCQEKRSSGPSSSLDNGNSLDVLKNHVLN
410 420 430 440 450 460
210 220 230 240 250 260
pF1KSD ELVETEKMYVDDLGQIVEGYMATMAAQGV----PESLRGRDRIVFGNIQQIYEWHRDYFL
::..::..:: .: .. :: : : . : ::.. :.:::. .:::.: : ::
CCDS55 ELIQTERVYVRELYTVLLGYRAEMDNPEMFDLMPPLLRNKKDILFGNMAEIYEFHNDIFL
470 480 490 500 510 520
270 280 290 300 310 320
pF1KSD QELQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEHVVSEFGD-SYFEELRQQLGHR
. :. : . :. .. :.... ..::. ::::::.:: . .... ..:.: ...: ::
CCDS55 SSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECAFFQECQRKLKHR
530 540 550 560 570 580
330 340 350 360 370 380
pF1KSD LQLNDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQAVEVMCFVPKRCNDMMTLGR
:.:.. :.:::::: :::::::..::: .. .: :..:...: . : :: :
CCDS55 LRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAMLDLLKSVNDSMHQIA
590 600 610 620 630 640
390 400 410 420 430
pF1KSD LRGFEGKLTAQGKLLGQDTF--WVTEPEAGGLLSSRGR----ERRVFLFEQIIIFSEA-L
. :. :.:. ::.. : : :. . ... ... .: .:..::.:. :.: . .
CCDS55 INGYIGNLNELGKMIMQGGFSVWIGHKKGATKMKDLARFKPMQRHLFLYEKAIVFCKRRV
650 660 670 680 690 700
440 450 460 470 480 490
pF1KSD GGGVRGGTQPGYVYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGIQRYVLQAADPAIS
.: . :.: .:. :.. .:. ..:: .: . : . :..::.. ..
CCDS55 ESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNRKFEIWYGEKE---EVYIVQASNVDVK
710 720 730 740 750
500 510 520 530 540 550
pF1KSD QAWIKHVAQILESQRDFLNALQSPIEYQRRESQTNSLGRPRGPGVGSPGRIRLGDQAQGS
..:.:.. .:: .:...:.. . . : :
CCDS55 MTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQISLQQNDEDLCRRWLSYIDEATMS
760 770 780 790 800 810
560 570 580 590 600 610
pF1KSD THTPINGSLPSLLLSPKGEVARALLPLDKQALGDIPQAPHDSPPVSPTPKTPPCQARLAK
CCDS55 NGK
820
>>CCDS55515.1 MCF2 gene_id:4168|Hs108|chrX (860 aa)
initn: 487 init1: 266 opt: 631 Z-score: 497.5 bits: 102.7 E(32554): 2.2e-21
Smith-Waterman score: 631; 31.6% identity (65.1% similar) in 361 aa overlap (176-524:472-828)
150 160 170 180 190 200
pF1KSD MLEPALATGEELPELTLLTTLLEGPGDKTQPPEEETLSQAPESEEEQKKKALERSMYVLS
: .: :..: : .. .. . .::.
CCDS55 LVTSGTPFFSSKQGKKTWRQNQSNLKIEVVPDCQEKRSSGPSSSLDNGNSLDVLKNHVLN
450 460 470 480 490 500
210 220 230 240 250 260
pF1KSD ELVETEKMYVDDLGQIVEGYMATMAAQGV----PESLRGRDRIVFGNIQQIYEWHRDYFL
::..::..:: .: .. :: : : . : ::.. :.:::. .:::.: : ::
CCDS55 ELIQTERVYVRELYTVLLGYRAEMDNPEMFDLMPPLLRNKKDILFGNMAEIYEFHNDIFL
510 520 530 540 550 560
270 280 290 300 310 320
pF1KSD QELQRCLKDPDWLAQLFIKHERRLHMYVVYCQNKPKSEHVVSEFGD-SYFEELRQQLGHR
. :. : . :. .. :.... ..::. ::::::.:: . .... ..:.: ...: ::
CCDS55 SSLENCAHAPERVGPCFLERKDDFQMYAKYCQNKPRSETIWRKYSECAFFQECQRKLKHR
570 580 590 600 610 620
330 340 350 360 370 380
pF1KSD LQLNDLLIKPVQRIMKYQLLLKDFLKYYNRAGMDTADLEQAVEVMCFVPKRCNDMMTLGR
:.:.. :.:::::: :::::::..::: .. .: :..:...: . : :: :
CCDS55 LRLDSYLLKPVQRITKYQLLLKELLKY-SKDCEGSALLKKALDAMLDLLKSVNDSMHQIA
630 640 650 660 670 680
390 400 410 420 430
pF1KSD LRGFEGKLTAQGKLLGQDTF--WVTEPEAGGLLSSRGR----ERRVFLFEQIIIFSEA-L
. :. :.:. ::.. : : :. . ... ... .: .:..::.:. :.: . .
CCDS55 INGYIGNLNELGKMIMQGGFSVWIGHKKGATKMKDLARFKPMQRHLFLYEKAIVFCKRRV
690 700 710 720 730 740
440 450 460 470 480 490
pF1KSD GGGVRGGTQPGYVYKNSIKVSCLGLEGNLQGDPCRFALTSRGPEGGIQRYVLQAADPAIS
.: . :.: .:. :.. .:. ..:: .: . : . :..::.. ..
CCDS55 ESGEGSDRYPSYSFKHCWKMDEVGITEYVKGDNRKFEIWYGEKE---EVYIVQASNVDVK
750 760 770 780 790
500 510 520 530 540 550
pF1KSD QAWIKHVAQILESQRDFLNALQSPIEYQRRESQTNSLGRPRGPGVGSPGRIRLGDQAQGS
..:.:.. .:: .:...:.. . . : :
CCDS55 MTWLKEIRNILLKQQELLTVKKRKQQDQLTERDKFQISLQQNDEDLCRRWLSYIDEATMS
800 810 820 830 840 850
560 570 580 590 600 610
pF1KSD THTPINGSLPSLLLSPKGEVARALLPLDKQALGDIPQAPHDSPPVSPTPKTPPCQARLAK
CCDS55 NGK
860
619 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 08:04:53 2016 done: Thu Nov 3 08:04:54 2016
Total Scan time: 4.300 Total Display time: 0.130
Function used was FASTA [36.3.4 Apr, 2011]